实时互动网 ·

Google DeepMind 发布 PaliGemma 2：全新开放式视觉语言模型系列（3B、10B 和 28B）

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

Google DeepMind推出的视觉语言模型PaliGemma 2系列包含九个不同参数和分辨率的预训练模型，适用于图像字幕和视觉问答等任务，具备灵活性和可扩展性，满足多样化用户需求。

🎯

❓

PaliGemma 2系列模型的参数大小分别为30亿（3B）、100亿（10B）和280亿（28B）。

PaliGemma 2支持224×224、448×448和896×896像素的分辨率。

PaliGemma 2在图像字幕和视觉问答任务上表现出色。

PaliGemma 2是开放重量的，用户可以直接替代或升级原始模型，从而提供更大的迁移学习和微调灵活性。

PaliGemma 2结合了SigLIP-So400m视觉编码器和Gemma 2语言模型，分三个阶段进行训练，使用不同的图像分辨率。

PaliGemma 2在OCR任务中取得了最高分，显示出精确度和召回率的提高。

🏷️

华为云发布Agentic AI系列新品打造智能时代“硅基黑土地”
华为云在上海INSPIRE大会上发布了Agentic Infra新范式及多款Agentic AI产品，旨在推动企业智能化转型。大会还推出“行业AI梦工厂”...
Google LiteRT-LM Speeds Up Local Inference Up to 2.2x With Gemma 4 Multi-Token Prediction
LiteRT-LM brings native support for Gemma 4 Multi-Token Prediction (MTP) draf...
技嘉科技推出INFINITY系列限定产品
技嘉科技在COMPUTEX 2026展前发布了INFINITY系列限定产品，以庆祝成立40周年。新产品包括支持DDR5 11400 MT/s的X870 A...
派早报：Google 相关资讯三则、华为发布智慧屏 S7 X Pro等
谷歌推出基于AI的应用Dreambeans，整合用户的Google服务信息，生成生活灵感内容，鼓励用户回归现实生活。该应用目前仅面向美国的Google A...
Hugo 静态博客实现 Google AdSense 广告位懒加载：从原理到实践
本文介绍了如何通过懒加载技术优化Hugo博客中的广告位，解决广告过多导致页面加载缓慢的问题。使用HTML5的<template>标签和Inte...
育碧曾经最重要的游戏系列，正式回归
又搬一个救兵。育碧在今天正式公布了又一款新游戏《雷曼传奇再叙》，预定于10月1日发售。该作品名义上是2013年发售的游戏《雷曼传奇》的重制版，但不仅使用最...