小红花·文摘

本文介绍了如何利用Google Gemini为家庭物品添加元数据，以提高搜索效率。作者开发了一套物品管理系统，通过AI分析照片增强物品的可检索性。尽管效果良好，但AI可能会错误识别物品或拒绝包含个人信息的照片。总体而言，Gemini使物品整理更加便捷。

不知道怎麼下後設資料？用AI幫你添增索引關鍵字 / Don't Know How to Add Metadata? Use AI to Write Keywords

布丁布丁吃什麼？ ·

公视地方新闻数据集包含100篇地方新闻，提供标题、链接、日期和全文，适用于自然语言处理和数据分析练习，如主题分析、新闻分类和情感分析，旨在帮助用户学习和研究。

公視地方新聞資料集 / PTS NEWS Local News Dataset

布丁布丁吃什麼？ ·

本文介绍了一种为视觉障碍学生设计的自然语言处理指导系统，利用语音技术实时转换文字问题，帮助学生理解内容。研究探讨了文本简化对不同读者可理解性的影响，并提出了新的网络可访问性纠正方法。EXAMS-V基准用于评估视觉语言模型，强调了数据集的复杂性和重要性。

ACCSAMS：自動將考試文件轉換為盲人和視覺障礙者可接觸的學習資料

BriefGPT - AI 论文速递 ·

永豐銀行打破資料束縛以MongoDB Enterprise Advanced優化客戶服務體驗

MongoDB ·

本文介绍了中华民国图书馆学会的一门课程，涵盖了数据挖掘技术在图书馆读者数据分析和应用中的应用。课程分为三个主题，分别是Weka简介、热点分析和时间序列预测。作者建议将这些内容重新安排成为6周的课程，每周2小时，并让学生可以使用不同的数据进行更多的实践。

資料探勘技術於圖書館讀者資料分析與應用 / Analysis and Application of Data Mining Technology in Library Readers' Data

布丁布丁吃什麼？ ·

本文介绍了使用ChatGPT分段输入数据的技巧和应用，ChatGPT是一种基于GPT-3.5架构的语言模型，可以生成对话回应、回答问题、提供解释等。文章提到了提问形式、分段输入数据等技巧，并探讨了收集IoT数据、归纳论文内容等应用。

在ChatGPT摘要分段輸入的資料 / Summary Information Entered in Segments in ChatGPT

布丁布丁吃什麼？ ·

Atlas 向量搜尋簡介：透過語意搜尋和 AI 在任何類型的資料上建置智慧型應用程式

MongoDB ·

这篇文章介绍了一份改编自Kaggle上的葡萄酒评价数据集，包含品酒师对不同酒的评价和生产国家信息。数据集选取了法国和意大利的评价各1000条，用于机器学习练习。文章提到了数据集的应用范例，如了解葡萄酒特点、评价词汇，以及通过机器学习预测生产国家。这份数据集为学习者提供了宝贵的练习资源，有助于提升专业知识和提供更好的信息和服务。

英文葡萄酒評價資料集 / Dataset: Wine Reviews

布丁布丁吃什麼？ ·

这篇文章介绍了一份改编自Kaggle上的電玩遊戲銷售量資料集。我将遊戲名稱与遊戲類別提取成独立的資料集，供文本探勘练习使用。資料集包含了世界各地的遊戲銷售排行、名稱、平臺、年份、類別、發行商、銷量等详细資訊。資料集中挑选了角色扮演和动作两种类型的遊戲名稱和類型，并呼籲读者思考遊戲命名是否与遊戲類型有关。資料集包含4804个训练集案例，属性方面有"Name"和"Genre"两个字段，其中"Name"为类别型，表示遊戲名稱，"Genre"为类别型，表示遊戲類型，包括动作遊戲和角色扮演遊戲。最后，这篇文章提出一个问题：遊戲的命名是否会与遊戲類型有关？读者可以根据提供的四个选项来表达自己的看法。

英文遊戲名稱資料集 / Dataset: English Game Title

布丁布丁吃什麼？ ·

這篇文章介紹了一份改編自Kaggle上的真假新聞資料集，可用於英文文本探勘練習。資料集包含新聞標題與是否為假新聞的屬性。作者提供了資料集的來源、下載連結，並介紹了目標屬性，即判斷新聞真假的標記。文章還提出了利用真假新聞判斷的問題，並列舉了幾個應用可能。判斷新聞真假可以用於言論審查、提醒撰稿記者與讀者、瞭解真實新聞風格以及製造以假亂真的新聞。然而，需要謹慎處理，確保其用途符合倫理和法律準則。

英文假新聞判斷資料集 / Dataset: USA Fake and Real News

布丁布丁吃什麼？ ·

這篇文章介紹了一份資料集，內容改編自Kaggle上TEDANCE WSDM發佈的假新聞分類資料集，資料集由中國的ByteDance機構收集，包含2000份標題，分為真假新聞，提供了「news_title」和「is_fake」兩個屬性。作者思考了標題判斷真假新聞的可行性，並提出讀者問題，探討是否能單靠標題辨別假新聞。資料集來自可信的資料來源，適合用於訓練機器學習模型。文章邀請讀者分享意見，增加了趣味性。

中文假新聞判斷資料集 / Dataset: Chinese Fake News

布丁布丁吃什麼？ ·

该文章介绍了一份改编自Kaggle上的Taptap Reviews手游评论数据集，可用于简体中文的文本挖掘练习。数据集来源于Taptap行动游戏网的玩家评价，包含4888条训练集数据，无缺失值。属性主要包括评论和评价类型，分为满意和不满意两类。该数据集为游戏产业提供了宝贵的玩家评价数据，帮助优化游戏体验，提升玩家满意度。游戏开发者能够更了解玩家心声，为玩家提供更符合需求的游戏，增强产品竞争力，赢得市场份额。

中文遊戲評價資料集 / Dataset: Chinese Mobile Games APP Reviews

布丁布丁吃什麼？ ·

该文章介绍了一个中文网络小说评分数据集，包含读者对小说的评论和评分，评分为0至5星，根据星级数量分为负面、中性和正面三类。数据集共有2100个训练数据和18个未知数据，还提供了精简版的训练集。属性包括评论和评价类型，目标属性为评价类型。文章探讨了评论与评价类型的关联性，并邀请读者留言回答。该数据集为研究评论与评价类型之间的关系提供了有趣的主题，通过分析评论内容，或许可以了解读者的意见和情感反应，进一步探讨评价对小说的影响。

中文小說讀者評論資料集 / Dataset: Chinese Net Novel Rating

布丁布丁吃什麼？ ·

這篇文章介紹了一個改編自Kaggle的鐵達尼號生存者資料集，供機器學習練習使用。資料集分為訓練集和測試集，訓練集包含每位乘客是否存活的結果，而測試集則用於評估模型的表現。資料集中的屬性包括乘客編號、船票等級、名字、性別、年齡、船上的兄弟姐妹、配偶人數、船上的父母、孩子的人數、船票編號、乘客票價、客艙編號和登船港口等。文章最後提出了一個問題：哪些屬性是影響乘客存活的關鍵因素？

鐵達尼號生存者資料集 / Dataset: Titanic Survived

布丁布丁吃什麼？ ·

該資料集是從Sakar與Kastro在2018年發佈的線上購物顧客購買意圖資料集中改編而來，共有12330筆購物行為記錄，屬性包括使用者的造訪次數、時間、聯絡資訊網頁的次數和時間、產品相關網頁的次數和時間等。該資料集可用於機器學習練習，探索使用者行為與購物意圖之間的關聯。

線上購物資料集 / Dataset: Online Shopping

布丁布丁吃什麼？ ·

這份資料集是從1996年的人口普查收入資料集改編而來，用於機器學習練習。包含訓練集和測試集，用於建立模型和驗證。屬性包括年齡、工作單位類型、教育程度、性別等。目標屬性是判斷年薪是否超過5萬美元。最有可能影響年薪的屬性是年齡、工作單位類型、教育程度、性別。

收入普查資料集 / Dataset: Census Income

布丁布丁吃什麼？ ·

本文主要介绍了与课程相关的数据，包括教师代号、班级代号、学生到课次数、学生到课等级、学生认为的课程难度以及与课程满意度相关的问题。学生需要根据里克特量表评价课程内容、教学方法、教材资源、课堂讨论、作业、实践应用和考试。

教學意見回饋資料集 / Dataset: Student Evaluation

布丁布丁吃什麼？ ·

这份数据集是基于2012年Moro等人发布的银行营销数据集改编而来，包含葡萄牙某银行的电话推销数据，共有45211位客户。数据集包含客户的年龄、职业、婚姻状况、教育水平等属性，目标属性是客户最后是否办理定存。

銀行行銷資料集 / Dataset: Bank Marketing

布丁布丁吃什麼？ ·

这篇文章介绍了一个修改自Paulo Cortez的学生表现数据集的资料集，用于教学。数据集包括了来自葡萄牙两所中学的学生成绩以及其他相关信息。为了教学需求，成绩属性被舍弃，只以学校作为目标属性。数据集共有32561个训练样本，16281个测试样本，以及41个未知数据。文章提到这个数据集可以用于预测、分群、热点分析等机器学习分析，但需要注意教学环境是否能承载这么大的数据量。最后，作者提出了对于这个数据集可以进行哪些分析方向的问题，欢迎留言回答。

學生資料集 / Dataset: Student Performance

布丁布丁吃什麼？ ·

DerbyJS是一款全站式雙向資料綁定MVC框架，可以讓前端和後端同步。它可以方便整合前後端、讓網頁操作跟後端的分析運算、資料庫同步。然而，DerbyJS並不適用於大部分的專案，最合理的用途是只有單機執行的應用。

全站式雙向資料綁定MVC框架：DerbyJS / Full-stack MVC Framework: DerbyJS

布丁布丁吃什麼？ ·

不知道怎麼下後設資料？用AI幫你添增索引關鍵字 / Don't Know How to Add Metadata? Use AI to Write Keywords

公視地方新聞資料集 / PTS NEWS Local News Dataset

ACCSAMS：自動將考試文件轉換為盲人和視覺障礙者可接觸的學習資料

永豐銀行打破資料束縛 以MongoDB Enterprise Advanced優化客戶服務體驗

資料探勘技術於圖書館讀者資料分析與應用 / Analysis and Application of Data Mining Technology in Library Readers' Data

在ChatGPT摘要分段輸入的資料 / Summary Information Entered in Segments in ChatGPT

Atlas 向量搜尋簡介：透過語意搜尋和 AI 在任何類型的資料上建置智慧型應用程式

英文葡萄酒評價資料集 / Dataset: Wine Reviews

英文遊戲名稱資料集 / Dataset: English Game Title

英文假新聞判斷資料集 / Dataset: USA Fake and Real News

中文假新聞判斷資料集 / Dataset: Chinese Fake News

中文遊戲評價資料集 / Dataset: Chinese Mobile Games APP Reviews

中文小說讀者評論資料集 / Dataset: Chinese Net Novel Rating

鐵達尼號生存者資料集 / Dataset: Titanic Survived

線上購物資料集 / Dataset: Online Shopping

收入普查資料集 / Dataset: Census Income

教學意見回饋資料集 / Dataset: Student Evaluation

銀行行銷資料集 / Dataset: Bank Marketing

學生資料集 / Dataset: Student Performance

全站式雙向資料綁定MVC框架：DerbyJS / Full-stack MVC Framework: DerbyJS

永豐銀行打破資料束縛以MongoDB Enterprise Advanced優化客戶服務體驗