小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
MBZUAI成立基础模型研究所,拓展全球布局

穆罕默德·本·扎耶德人工智能大学成立基础模型研究所,设立硅谷、巴黎和阿布扎比实验室,推动阿联酋经济多元化。核心项目PAN为无限模拟世界模型,IFM还推进K2和JAIS系统,后者为先进阿拉伯语语言模型。

MBZUAI成立基础模型研究所,拓展全球布局

全球TMT-美通国际
全球TMT-美通国际 · 2025-05-26T02:05:10Z

本研究开发了一种基于变压器的阿拉伯反向词典系统,旨在帮助用户根据描述找到单词,提升阿拉伯自然语言处理的效果,为语言学习和专业交流提供了重要工具。

推进阿拉伯语反向词典系统:基于变压器的方法及数据集构建指南

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

本研究提出了一种名为Sadeed的小型语言模型,旨在解决阿拉伯语标点问题。Sadeed通过在高质量数据集上的微调,表现优越,超越传统模型,并引入新的评估基准SadeedDiac-25,推动阿拉伯语自然语言处理的发展。

Advancing Arabic Diacritization Through Small Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

本研究提出了一种新方法,通过将阿拉伯语注入以英语为主的小型开源模型,成功训练出Kuwain 1.5B模型。该模型在阿拉伯语性能上平均提升8%,为双语模型训练提供了高性价比的解决方案。

Kuwain 1.5B: Building an Arabic SLM through Language Injection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z

该研究采用大规模弱监督学习方法,解决阿拉伯语语音识别中的标注数据不足问题。训练的ASR模型在缺乏人工标签的情况下,仍在标准测试中表现优异,验证了弱监督学习在低资源环境中的有效性。

Advancing Arabic Speech Recognition Through Large-Scale Weakly Supervised Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-16T00:00:00Z
新阿拉伯语AI模型以仅7亿参数和文化智能超越GPT-3.5

R7B阿拉伯语模型是一个拥有7亿参数的AI,专为阿拉伯语处理而设计,经过2000亿阿拉伯语标记的微调,具备文化意识,超越了GPT-3.5,适合企业使用。

新阿拉伯语AI模型以仅7亿参数和文化智能超越GPT-3.5

DEV Community
DEV Community · 2025-03-24T11:46:54Z
人工智能突破:新方法将阿拉伯语处理规模减少75%,同时提升性能

这项研究提出了一种新方法,使阿拉伯语处理的规模减少75%,同时提升性能。该方法通过分离词根和模式,改善了非连接语言的标记化,降低了词汇量,保持了语言意义,并在下游任务中提高了20%的表现。

人工智能突破:新方法将阿拉伯语处理规模减少75%,同时提升性能

DEV Community
DEV Community · 2025-03-24T11:45:03Z

本文提出了一种基于双向LSTM/CRF的模型,解决了不同语言命名实体识别中的模型依赖性问题。该模型通过正交线性变换将目标语言的词嵌入转化为源语言的词嵌入,有效识别阿拉伯语命名实体。

Language-Independent Named Entity Recognition through Orthogonal Transformation of Word Vectors

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z
Mistral AI推出Saba:阿拉伯语和南印度语言的区域语言模型

Mistral AI推出了Mistral Saba,这是一个专为阿拉伯语和南印度语言设计的24亿参数语言模型。该模型通过中东和南亚的特定数据集训练,旨在提供更准确的语言和文化响应。Mistral Saba在阿拉伯语任务中表现优异,超越了其他大型模型。该模型可通过API使用,并可在本地部署。

Mistral AI推出Saba:阿拉伯语和南印度语言的区域语言模型

InfoQ
InfoQ · 2025-03-06T13:15:00Z

本研究解决了阿拉伯语光学字符识别(OCR)领域的评估体系不足,提出了KITAB-Bench基准,包含8809个样本,覆盖多达9个主要领域及36个子领域。研究发现,现代视觉语言模型在字符错误率方面较传统OCR方法提高了60%的性能,为阿拉伯文档分析提供了一个系统的评估框架,促进该领域的发展。

KITAB-Bench:阿拉伯语光学字符识别和文档理解的综合多领域基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究探讨了阿拉伯语情感分析的现状,指出了现有研究面临的挑战与局限,强调了深度学习在该领域的重要性,并提出了未来的研究方向。

A Comprehensive Survey of Contemporary Arabic Sentiment Analysis: Methods, Challenges, and Future Directions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-06T00:00:00Z

本研究探讨了阿拉伯地区的多语言和代码切换现象对自然语言处理技术的影响,分析了当前研究进展、面临的挑战及未来方向,强调了发展针对代码切换的阿拉伯语自然语言处理技术的重要性。

A Survey of Code-Switched Arabic Natural Language Processing: Progress, Challenges, and Future Directions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究解决了阿拉伯语教育工具匮乏的问题,提出了一种基于先进语言模型的阿拉伯填字游戏生成器。该生成器使用了名为Arabic-Clue-Instruct的超过50,000条目的数据集,能够为特定文本和关键词生成相关线索。研究结果表明,这种新的工具不仅提高了语言学习的趣味性和效果,还为互动和认知学习技术树立了新标准。

从阿拉伯语文本到拼字游戏:LLM驱动的阿拉伯教育填字游戏开发

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-19T00:00:00Z
轻松将数字转换为单词:Tafqeet.com终极多语言工具

Tafqeet.com是一个在线平台,支持将数字转换为阿拉伯语、英语和法语的单词,适用于多种货币,提供准确的转换和API接口,方便开发者集成,确保财务文档的准确性。

轻松将数字转换为单词:Tafqeet.com终极多语言工具

DEV Community
DEV Community · 2025-01-05T03:15:26Z

本研究针对现有大型语言模型(LLMs)在知识评估方面过于侧重英语的问题,提出了一种新的阿拉伯语多选题数据集AraSTEM,旨在全面评估这些模型在STEM学科的知识。研究发现,许多现有模型在该数据集上表现不佳,强调了开发更本地化语言模型的必要性。

AraSTEM: 一个评估大型语言模型在STEM学科知识的阿拉伯语多选题基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-31T00:00:00Z
阿拉伯编程语言的语言与经济影响

开发基于阿拉伯语的编程语言将丰富阿拉伯词汇,提升数字素养,促进教育资源,激励创新,吸引投资,并增强文化认同,从而推动阿拉伯地区经济增长,确保阿拉伯语在数字时代的相关性。

阿拉伯编程语言的语言与经济影响

DEV Community
DEV Community · 2024-12-22T13:49:26Z

本研究评估了阿拉伯语自动语音识别(ASR)模型在多方言数据集上的表现,提出了开放通用阿拉伯语ASR排行榜,并分析了模型的鲁棒性、适应性、效率和内存消耗,为阿拉伯语ASR社区提供参考。

开放通用阿拉伯语自动语音识别排行榜

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究针对古兰经问答系统中现代标准阿拉伯语与经典阿拉伯语的语言差距,通过扩展数据集和微调语言模型,显著提升了系统性能,特别是在无答案情况下的成功率从25%提高到75%。

Optimized Quran Passage Retrieval: Based on an Expanded QA Dataset and Fine-Tuned Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

本研究分析了大型语言模型(LLMs)在方言阿拉伯语(DA)中的生成质量与理解质量。结果显示,LLMs在生成质量上优于理解质量,后处理可能削弱其能力,但少量示例可以改善这一问题。

AL-QASIDA:系统分析方言阿拉伯语中的大型语言模型质量与准确性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出了一种新语言模型Sporo AraSum,旨在提升阿拉伯语医疗领域的复杂交流。研究表明,该模型在性能和处理语言细微差别方面优于现有模型,能够有效减少AI幻觉风险,并优化临床文档生成。未来将通过真实数据验证这些发现。

在阿拉伯语中提升复杂医疗交流的Sporo AraSum:超越现有大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码