百度大脑 ·

基于视觉大模型，百度网盘把「猫」换成了「黄色的猫」

💡 原文中文，约4200字，阅读约需10分钟。

📝

内容提要

百度网盘推出基于自然语言的图片内容语义检索方法，利用深度学习和人工智能技术，将每张图片转化为向量表示，实现搜索和匹配。用户提出了一些建议和意见，需要更精细的特征提取和引入文字OCR。网盘致力于技术创新，提供更好的使用体验。欢迎使用高级图片搜索功能并积极反馈。

🎯

关键要点

百度网盘推出基于自然语言的图片内容语义检索方法，利用深度学习和人工智能技术。
用户在寻找照片时面临挑战，传统标签搜索方法无法满足复杂的搜索需求。
新方法通过将图片转化为向量表示，实现自然语言搜索，提升搜索准确性和灵活性。
百度网盘采用文心·CV大模型VIMER-ViLP，能够理解和识别广泛的图片内容。
项目经历了四个月的开发，最终于2022年8月底上线。
通过提取图片的元信息，实现时间、地点、人物等复杂搜索。
优化了用户搜索意图的理解，提升搜索结果的相关性。
采用端云一体检索架构，提升检索速度和效率。
用户可以搜索图片中的文字，满足多样化的找图需求。
用户反馈促使技术和产品的持续改进，未来将引入更多功能以满足个性化需求。

🏷️

标签

人工智能图片搜索大模型深度学习用户反馈百度网盘

➡️

继续阅读

Visual Studio Code 1.130（Insiders）
Visual Studio Code 1.130 Insiders版本发布，新增功能更新。用户可通过提交日志和已关闭问题列表跟踪进展，鼓励大家尽快尝试新特性。
小红书大模型IMO满分夺金，第三题解法让冠军选手直呼优雅
中国大模型首次获得IMO官方金牌水平认证
Q2 2026 earnings call: Remarks from our CEO
Read an edited transcript of Sundar Pichai’s remarks from the Q2 2026 Alphabe...
Django 6.1 release candidate 1 released
Django 6.1 release candidate 1 is now available. It represents the final oppo...
Price-hiked iPads are a little cheaper right now
A number of Apple products got more expensive last month, so we’re happy to f...
iOS code could reportedly let Apple cut off apps when users miss iPhone payments
Code found in an iOS 27 beta would allow Apple to put a financed iPhone in &#...