机器之心 ·

GPT做不好图生成？Tokenization是关键！新方法重新定义图生成和表示方式

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

G2PT是一种新型图生成模型，通过序列化表示提高计算效率，显著优于传统的邻接矩阵方法。该模型在药物设计和图属性预测等多个任务中表现出色，展现了广泛的适应性和优越性能，为图生成领域提供了新思路。

🎯

❓

G2PT模型通过序列化表示提高计算效率，显著优于传统的邻接矩阵方法，适应性强，表现出色。

G2PT采用基于序列的tokenization方法，利用图的稀疏性，减少计算成本和内存占用。

G2PT通过拒绝采样微调和强化学习技术，能够生成特定属性的分子图，优化理化性质。

在多个基准数据集上，G2PT的表现显著优于或匹配现有最先进模型，尤其在生成有效性和唯一性上表现优异。

随着模型规模的增加，G2PT的生成性能显著提升，但在一定规模后趋于饱和，符合neural scaling law。

G2PT在图属性预测任务中表现卓越，达到了与当前最先进方法相媲美的性能。

🏷️

游戏行业中的Apache Spark实时模式：更好的实时会话处理方式
本文讨论了如何在游戏行业中利用Apache Spark的实时模式处理会话数据，实现亚秒级延迟。通过transformWithState操作符，Spark高...
Deploy背后的团队：以DigitalOcean的方式交付AI
在旧金山举行的Deploy 2026活动中，开发者与客户探讨了简化AI产品构建与扩展的方法。DigitalOcean推出了AI-Native Cloud，...
亚马逊的搜索栏将生成无法购买的AI生成产品
亚马逊更新了搜索栏，用户可以根据描述查看AI生成的服装和家居商品图片，帮助用户在记不清具体名称时找到所需商品。该功能将于安卓和iOS应用上线。
为GPT-Rosalind引入新功能
GPT-Rosalind系列模型更新，专为生命科学研究设计，提升了药物发现智能和工具使用能力。该模型在生物学、药物化学和基因组学等领域表现出显著提升，通过...
谷歌搜索提升你的二手和复古购物的五种方式
2026年复古潮流再度兴起，用户对“复古”和“如何淘货”的搜索兴趣达到新高。借助Google工具，用户可以通过AI规划二手购物，使用Google Lens...
浏览器指纹与反爬虫：TLS JA3、HTTP/2指纹原理及绕过方法
本文讨论了数据抓取中的反爬虫技术，重点介绍了浏览器指纹，包括TLS指纹和HTTP/2指纹。通过分析请求头、TLS握手和HTTP/2设置，服务器能够识别客户...