小红花·文摘

麻省理工学院科学家研究临床人工智能时代的记忆风险

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) ·

本研究提出MEG方法，旨在解决大型语言模型在医学领域的知识相关性不足和高训练成本问题。通过轻量级映射网络整合图嵌入，MEG在四个医学数据集上提高了10.2%的准确率。

Research on Question Answering with Large Language Models Enhanced for Medical Knowledge

BriefGPT - AI 论文速递 ·

本文研究通过因子论证为贝叶斯网络推理构建自然语言解释，以提升易用性和准确性。提出的算法优化了论证展示，显著改善了医学领域用户的理解效果。

Explaining Bayesian Networks in Natural Language using Factor Arguments: An Evaluation in the Medical Domain

BriefGPT - AI 论文速递 ·

该论文探讨了欧盟委员会翻译总局推出的翻译记忆库及其在翻译专业和语言技术中的应用。研究发现，神经机器翻译模型在医学领域的表现优于其他领域模型，且通过高质量数据合并可提升模型性能。此外，针对医疗领域的机器翻译，研究引入专业术语和指令调优，显著提高了翻译质量和术语一致性。

创建领域特定翻译记忆以进行机器翻译

BriefGPT - AI 论文速递 ·

本文探讨了多领域神经机器翻译模型在医学领域的应用，发现领域内模型在自动度量和术语错误方面优于领域外模型。研究表明，较小的专业语言模型在解析电子健康记录时表现更佳。评估大型语言模型在临床任务中的表现，发现它们在零样本和少样本场景中接近最先进水平，但在分类和关系抽取任务上不如专门训练的模型。最后，提出了优化医学模型的方法，强调了对领域特定微调的评估需求。

针对医疗领域机器翻译的指令调优大型语言模型

BriefGPT - AI 论文速递 ·

本研究探讨了大型视觉语言模型（LVLMs）中的幻觉问题，提出了新的评估基准和数据集，以提高模型的准确性和可靠性。研究发现医学领域的LVLMs更易产生幻觉，并强调了模型在实际应用中的稳健性需求。同时，开发了细粒度评估指标FAITHSCORE，揭示了当前模型在生成内容时的不足，为未来改进提供了方向。

BEAF：评估视觉语言模型中的幻觉的前后变化

BriefGPT - AI 论文速递 ·

本文介绍了结合知识图谱与大型语言模型（LLMs）的方法，如Think-on-Graph（ToG）、GNN-RAG和KG-RAG，旨在提升推理能力并减少虚构内容。这些方法在多跳问题和知识密集型任务中表现优异，显著提高了问答系统的性能和准确性，尤其在医学和客户服务领域取得了显著成效。

Think-on-Graph 2.0: 基于知识图引导的深度可解释大型语言模型推理

BriefGPT - AI 论文速递 ·

本文探讨了通过使用大型语言模型（LLMs）如Llama 2和PMC-LLaMA，改进多语言语义解析系统，特别是在语篇分析和医学领域的应用。研究表明，结合自上而下和自下而上的解析策略与现代架构，能够显著提升解析器的泛化能力和准确性。

LLaMIPa: 增量对话解析器

BriefGPT - AI 论文速递 ·

本文探讨了检索增强生成（RAG）在大型语言模型（LLMs）中的应用，特别是在医学领域。研究提出了多种RAG框架，如DR-RAG和PG-RAG，旨在提高文档检索的准确性和问答系统的效率。实验结果表明，这些框架在处理复杂查询和提升答案准确性方面表现优异，展示了RAG在知识密集型任务中的潜力。

PlanRAG：一种计划 - 检索增强的生成大型语言模型作为决策耠

BriefGPT - AI 论文速递 ·

本文探讨了知识图谱嵌入在推荐系统、查询扩展和实体嵌入中的应用，提出了基于随机游走和词嵌入的OWL2Vec*方法，并分析了不同图投影方法对嵌入生成和公理预测的影响。研究表明，知识图谱嵌入能够有效捕捉实体间的语义关系，提升大语言模型在医学领域的相似性评估能力。

本体嵌入：方法、应用和资源综述

BriefGPT - AI 论文速递 ·

本文探讨了检索增强生成（RAG）在大型语言模型（LLMs）中的应用，提出了DuetRAG和CRAG等改进方法，以提高知识检索和生成质量。研究显示，RAG在医学领域表现突出，能有效提升基于医药数据库的查询准确性。未来的研究方向包括优化技术堆栈和评估方法，以增强LLMs的适应性和应用潜力。

DR-RAG: 将动态文档相关性应用于检索增强问答生成

BriefGPT - AI 论文速递 ·

基于检索增强生成（RAG）的大规模语言模型在医学领域表现出显著提升。研究提出了Distill-Retrieve-Read框架，证明其在证据检索准确性方面的优势。通过关键字检索评估多种语言模型，发现它们在科学文档推理中可能使用虚假证据。新提出的适应性问答框架能根据查询复杂性动态选择策略，提高问答系统的效率和准确性。

基于 LLM 的问答系统中检索组件的评估

BriefGPT - AI 论文速递 ·

本文介绍了一种自动生成问答对的框架，应用于医学领域，以提升问答系统的准确率。研究表明，基于生成的问答对微调的QA模型可与人类标注数据的模型竞争。此外，提出了适用于教育领域的多语言问答生成模型AutoQG，能够生成测试学生理解能力的问题与答案。

SciQAG: 自动生成科学问答数据集的框架及细粒度评估

BriefGPT - AI 论文速递 ·

Med-Gemini是一种新型多模态模型，在医学领域表现优异，超越了GPT-4。它在多个医学基准测试中取得最佳性能，展现出强大的推理能力和长语境处理能力。尽管仍需进一步评估，但在医学文本摘要等任务上已超越人类专家，显示出广泛的应用潜力。

推进 Gemini 的多模医疗能力

BriefGPT - AI 论文速递 ·

本文介绍了多个针对大型语言模型（LLMs）的评估基准，如M3KE、CMMLU和E-EVAL，涵盖自然科学、社会科学和K-12教育等领域。研究发现，中文优先的模型在某些学科表现优于英文模型，但在复杂科目如数学上仍需改进。同时，KMMLU和MedBench等基准揭示了韩语和医学领域LLMs的能力与局限，强调了进一步改进的必要性。

LHMKE：用于中文大语言模型的大规模综合多学科知识评估基准

BriefGPT - AI 论文速递 ·

本文介绍了一种名为GarDA的无监督分割方法，能够在医学领域中对多个未标记数据进行自适应处理，显著提升分割模型性能。该研究结合传统对抗性适应与判别器，有效解决了领域自适应问题，并在医学数据集上超越了现有方法。

智慧医疗领域增量适应的过去无关生成式回放

BriefGPT - AI 论文速递 ·

通过自然语言处理和多模态范式，ChatGPT 加快了医学领域问题回答的进展。它处理了医学环境下大规模、多样化、不平衡或无标签数据分析的场景，并在不同任务和数据集中应用。当前的挑战和未来医学领域研究提供了机遇和创新。

开发生物和医学 ChatGPT：生物医学问答的完整概述

BriefGPT - AI 论文速递 ·

本研究提出并评估了一种综合人工智能在医学领域的框架（HAIM），以促进利用多模态输入实现人工智能系统的生成和测试。该框架可在医疗保健环境中进行研究和部署，并通过使用Shapley值量化每个模态和数据源的贡献，展示了多模态输入在不同医疗任务中的必要性。

AliFuse：多模医学数据对齐与融合用于计算机辅助诊断

BriefGPT - AI 论文速递 ·

该研究提出了一种基于自监督遮掩采样蒸馏方法的视觉Transformer，在医学领域的各种任务中表现出较好的性能和隐私保护能力。

具备 Wasserstein 距离感知的随机视觉转换器

BriefGPT - AI 论文速递 ·

该论文综述了198篇医疗决策支持的可解释人工智能解决方案，大多数采用了模型无关的可解释人工智能技术，深度学习模型被广泛应用。需要加强医疗和人工智能专家之间的合作，以指导可解释人工智能解决方案在医学领域的设计、实施和评估。

基于可解释人工智能特征保持损失的医学图像去噪

BriefGPT - AI 论文速递 ·