小红花·文摘 - 小红花技术领袖俱乐部

基于Transformers.js的多模态浏览器AI：图像与语音处理

基于Transformers.js的多模态浏览器AI：图像与语音处理

MachineLearningMastery.com ·

GitHub 热门项目周刊 · 第 11 期 · 2026 年第 21 周

GitHub 热门项目周刊 · 第 11 期 · 2026 年第 21 周

浅时光博客 ·

新技术使人工智能模型在学习过程中更加精简和快速

新技术使人工智能模型在学习过程中更加精简和快速

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) ·

CS231n 讲义 I：图像分类

CS231n 讲义 I：图像分类

Louis Aeilot's Blog ·

CS231n 讲义 I：图像分类

CS231n 讲义 I：图像分类

Louis Aeilot's Blog ·

OpenAI CLIP：通过文本学习零样本图像识别的模型

OpenAI CLIP：通过文本学习零样本图像识别的模型

ByteByteGo Newsletter ·

手把手教你在Arm边缘AI计算平台上部署飞桨模型

手把手教你在Arm边缘AI计算平台上部署飞桨模型

百度大脑 ·

服务地理空间、视觉及更多：在vLLM中实现多模态输出处理

服务地理空间、视觉及更多：在vLLM中实现多模态输出处理

vLLM Blog ·

科技爱好者周刊（第 363 期）：最好懂的神经网络解释

科技爱好者周刊（第 363 期）：最好懂的神经网络解释

阮一峰的网络日志 ·

通过决策树看图像

通过决策树看图像

MachineLearningMastery.com ·

我如何构建并比较自定义CNN与MobileNetV2用于船只图像分类

我如何构建并比较自定义CNN与MobileNetV2用于船只图像分类

DEV Community ·

本研究提出了一种名为KO的神经网络优化器，基于动力学理论和偏微分方程模拟。KO通过粒子系统演化重新构思参数更新，增强参数多样性，有效减缓参数凝聚现象。实验结果显示，KO在图像和文本分类任务中的表现优于传统优化器，如Adam和SGD，准确率更高。

KO：基于动力学的神经网络优化器与偏微分方程模拟方法

BriefGPT - AI 论文速递 ·

本研究提出了速度正则化Adam（VRAdam），旨在解决传统优化算法在训练深度神经网络时的振荡和收敛问题。VRAdam通过引入基于速度的惩罚项，优化动态学习率，从而提升了图像分类和语言建模等任务的性能。

A Physics-Inspired Optimizer: Velocity Regularized Adam

BriefGPT - AI 论文速递 ·

本研究提出了一种新的多层递归注意模型（MRAM），有效模拟人类视觉体系的层次结构，改善了注视与扫视的平衡，并在图像分类基准测试中超越了现有模型。

Emergence of Fixational and Saccadic Movements in a Multi-Level Recurrent Attention Model

BriefGPT - AI 论文速递 ·

本研究提出了一种神经启发的神经响应归一化（NeuRN）层，旨在提升深度学习模型在未知目标领域的图像分类性能。实验结果表明，NeuRN在跨域任务中表现出色，为未来模型的发展提供了支持。

NeuRN: A Neural-Inspired Approach for Domain Generalization in Image Classification

BriefGPT - AI 论文速递 ·

本研究提出了一种名为Biomed-DPT的双模态提示调优技术，旨在提升生物医学图像分类的提示学习效果。通过结合临床提示、领域适应提示和视觉提示中的零向量软提示，该方法显著提高了分类准确率。

Biomed-DPT: A Dual-Modal Prompt Tuning Technique for Biomedical Vision-Language Models

BriefGPT - AI 论文速递 ·

该研究提出了一种新方法，通过卷积神经网络直接从傅里叶相位显微镜测量中进行图像分类，避免了高计算成本的重建过程。该方法提高了12%的分类性能，减少了数据量和采集时间，同时保持了分类准确性。

Direct Image Classification from Fourier Ptychographic Microscopy Measurements without Reconstruction

BriefGPT - AI 论文速递 ·

本研究提出了seq-JEPA模型，旨在解决自监督算法在视觉表征学习中的局限性，特别是二视图范式下的不变性与不等变性之间的权衡。该模型能够同时学习这两种表示，显著提升图像分类等任务的性能。

seq-JEPA: Autoregressive Predictive Learning of Invariant-Equivariant World Models

BriefGPT - AI 论文速递 ·

本研究提出了一种新的深度学习方法，解决乳腺癌组织病理图像分类中注释数据有限的问题。改进的方法显著提升了模型在有限标注下的分类性能，具有重要的临床应用潜力。

DCS-ST Method for Classification of Breast Cancer Histopathology Images with Limited Annotations

BriefGPT - AI 论文速递 ·

本研究评估了内存受限环境中的轻量级深度学习模型，填补了低内存设备上图像分类的研究空白。通过基准测试五种架构，发现迁移学习显著提升了模型在复杂数据集Tiny ImageNet上的准确性和效率，为优化深度学习系统提供了建议。

Comparative Analysis of Lightweight Deep Learning Models on Memory-Constrained Devices

BriefGPT - AI 论文速递 ·