机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化了数据爬取流程。
Meta AI研究团队提出ExFM框架,解决了万亿级基础大模型在广告推荐中的高效服务问题。该框架通过外部蒸馏和动态适应机制,实现教师模型与学生模型的解耦,显著降低计算成本和延迟,提升模型性能,推动广告推荐系统优化。
Understanding the latest project to build speech-to-speech with open source technologies.
德国DESY研究人员提出利用大型语言模型(LLM)自主调节粒子加速器,展示了其在调优任务中的潜力。尽管LLM的表现尚未达到最先进算法的水平,但未来有望成为操作员的辅助工具,提高加速器调节效率。
近年来,儿童和青少年的心理健康不断恶化。大型语言模型(LLMs)的出现为监测和干预提供了希望。研究发现GPT4与人际标注者一致性相当,合成数据性能更高,但在否定和事实性问题上仍有错误。
该文章介绍了对llama3.1模型进行微调的过程和结果,通过7方面review超过GPT4。微调过程中遇到的问题包括模版冗余后缀、推理结果中存在空项以及模型推理格式问题。最终得出的结论是llama3.1比llama3更强悍,微调超过GPT4。
Meta发布了备受期待的Llama-3.1系列模型,包括405B“超级杯”型号,成为首个能与最强大模型媲美的开源模型。Llama-3.1系列包括8B、70B和405B三个版本,具有128k的扩展上下文长度和支持八种语言。405B模型目前是最大的开源模型,在各种评估指标上超过了GPT-4。SiliconCloud在其平台上推出了Llama-3.1系列模型,使开发者更容易访问和使用这些先进模型。该平台还提供加速推理和实惠的价格。除了Llama-3.1,SiliconCloud还提供各种其他开源语言模型、图像生成模型和代码生成模型。开发者可以免费使用这些模型,消除了开发和大规模推广中的计算成本。SiliconCloud旨在为开发者提供更快、更便宜、更全面的模型API,以实现更流畅的用户体验。
本研究评估了GPT4、GPT3.5 Turbo和Google Gemini模型在压路机领域问题上的性能,发现它们在使用ATP推理策略时的性能与一次性线性思路相当,倾向于自下而上的推理过程。推理策略对于推导出小而相关的公式集有益处。
近年来,儿童和青少年心理健康恶化,大型语言模型(LLMs)为监测和干预提供希望。研究人员创建了一个Reddit帖子的新数据集,用于标注创伤、不稳定性、病情、症状、自杀倾向和治疗等类别。GPT4与人际标注者一致,合成数据性能更高。模型在否定和事实性问题上仍有错误。模型的高性能是由于真实数据的复杂性而非固有优势。
研究人员通过将AI的“慢思考”结果蒸馏进“快思考”,使Llama2的表现提升了257%,超过了GPT4,同时降低了推理成本。他们使用了四种不同的系统2方法进行微调,发现这种模式使系统1模型的表现大幅提升,甚至超过了真正的系统2模型。这种蒸馏方法在实时交互和移动设备部署等场景下具有优势。
深度求索团队更新了DeepSeek-V2模型,新版本DeepSeek-V2-Chat在数学解题、逻辑推理、编程等方面性能提升了16%,对战胜率从41.6%提升到了68.3%。团队还优化了模型的指令跟随能力,提升了用户体验。SiliconCloud平台上线了DeepSeek-V2-Chat的推理加速版,速度快且输出准确。SiliconCloud还提供多种开源大语言模型和代码生成模型。
上海天鹜科技与长春金赛药业完成全球首款经大模型设计的蛋白质产品开发。英伟达开源最强通用模型Nemotron-4 340B,途深智合开源国内首个自然语言蛋白质大模型TourSynbio™。Cyrus Biotechnology分拆子公司Levitate Bio。GSK与Ochre Bio合作开发肝脏疾病治疗方法。
深度求索开源了DeepSeek-Coder-V2模型,是全球首个在代码、数学能力上超越GPT-4-Turbo等的开源代码大模型。DeepSeek-Coder-V2包含236B与16B两种参数规模,支持338种编程语言。SiliconCloud上线了DeepSeek-Coder-V2开源模型,并提供大模型推理加速服务。新用户还送1亿token。
KLING is the latest AI video generator that could rival OpenAI's Sora, OpenAI is restarting its robotics research group, and more!
黄仁勋在COMPUTEX上展示了英伟达的最新技术,包括GPT-4模型和Blackware GPU。他强调了GPT-4的训练参数达到了1.8T,展示了Blackware GPU的多GPU集成解决方案。然而,英伟达面临着摩尔定律失效、中心转移和巨头合作等威胁。尽管如此,英伟达仍然是一个轻公司,依靠缩放定律和扩大垄断来保持竞争优势。
Open AI 已经扩大了对 GPT-4 的免费访问,而苹果的未来尚不确定。Open AI 正卷入与斯嘉丽·约翰逊的诉讼中。GPT-4O 已经向有限制的免费用户开放。苹果的 WWDC 可能会让人失望。
本文介绍了三种免费使用GPT4的方法:COZE、copilot和加州大学伯克利分校的开源AI研究平台。这些方法提供了各种强大功能,如生成图片、总结文档、自动生成配音等。COZE是字节跳动开发的AI工具开发平台,提供全功能的GPT4模型;copilot是微软开发的日常办公助手,可以在Edge浏览器和Bing搜索上使用;加州大学伯克利分校的平台包含了常用的大模型。
近年来,儿童和青少年的心理健康状况恶化。大型语言模型(LLMs)为监测和干预提供希望。研究人员使用Reddit帖子数据集,比较了GPT3.5和GPT4与专家标签的一致性。结果显示,GPT4与人际标注者相当,并在合成数据上表现更好。然而,模型在否定和事实性问题上仍有错误。模型的高性能主要归功于真实数据的复杂性。
ElevenLabs previews music-generating AI model, New Microsoft AI model may challenge GPT-4 and Google Gemini, and more!
研究比较了NLP模型生成反事实样本的能力和对数据增强的影响。发现LLMs生成的反事实样本改动较大,与人工生成的样本相比效果差。LLMs对偏标签数据的评估偏向性明显,而GPT4更稳健,与自动评价指标相关性好。研究结果揭示了限制和未来研究方向。
完成下面两步后,将自动完成登录并继续当前操作。