基于 Uniprot 开放数据集使用 Cytoscape.js 和 Amazon Neptune 图形数据库快速搭建无服务化蛋白质数据分析平台

亚马逊AWS官方博客 ·

基于 Uniprot 开放数据集使用 Cytoscape.js 和 Amazon Neptune 图形数据库快速搭建无服务化蛋白质数据分析平台

💡 原文中文，约11700字，阅读约需28分钟。

📝

内容提要

本文介绍了使用AWS CDK在亚马逊云科技上构建蛋白质相似度的方案平台，并介绍了如何使用Amazon Neptune作为图形数据库和Cytoscape.JS Web组件实现Web端的可视化OG网络。文章还介绍了如何使用CDK Synth初始化CloudFormation模版和使用cdk deploy命令部署整个方案，以及如何使用Jupyter Notebook进行数据初始化和如何访问网站。此外，文章还介绍了平台的功能，包括根据Protein ID检索网络信息、设置网络深度和查看选中Protein的Annotation信息。最后，文章提到该方案的代码已经以开源的形式发布在Github中。

🎯

关键要点

当前蛋白质研究主要集中在已知蛋白上，未充分研究的蛋白占比高达60%-90%。
呼吁启动'未充分研究蛋白计划'，促进对未知蛋白的研究。
方刚团队提出新的蛋白相似度衡量尺度，并构建蛋白质网络以解释同源性不一致的原因。
基于蛋白质相似度，方刚团队希望构建一个SaaS平台，利用亚马逊云科技的开放数据集Uniprot。
平台功能包括OG网络信息检索、网络深度设置和Annotation信息查看。
使用Amazon Neptune作为图形数据库，支持高性能查询和数据管理。
采用Serverless架构，降低应用维护成本，提升平台易用性。
使用Cytoscape.JS实现Web端OG网络的可视化，方便用户操作。
部署前需准备AWS账号、密钥和EC2实例等资源。
通过CDK脚本实现自动化部署，简化私有化平台的搭建过程。
数据初始化通过Jupyter Notebook进行，支持OG网络和Uniprot数据的加载。
平台支持自定义域名解析，便于用户访问。
提供根据Protein ID检索网络信息、设置网络深度和查看Annotation信息的功能。
方案代码已开源发布在Github，欢迎社区贡献和反馈。

🏷️

继续阅读

墨梅博客 1.11.0 发布与数据库用量超支教训 | 2026 年第 13 周草梅周报
草梅周报更新了墨梅博客1.11.0版本，新增语音输入和系统设置功能。开发中遇到数据库超支问题，建议用户监控使用量并定期备份。欢迎用户参与开发与测试。
平台团队如何消除Kubernetes基础设施上的43,800美元“隐性税”
虚拟集群工具如vCluster、Kamaji和k0smotron通过降低Kubernetes控制平面成本，支持开发者自助服务，减少租户隐性费用，提供资源隔...
趋境ATaaS平台发布，打造日均万亿产能的“Token工厂”
趋境科技推出ATaaS平台，旨在解决算力与Token产出失衡，推动AI推理服务向Token服务转型。郑纬民院士强调，未来智能基础设施需围绕Token服务重...
什么是数据库触发器？带有PostgreSQL示例的实用介绍
数据库触发器是自动响应特定事件的功能，如记录更新、数据验证和同步。本文介绍了触发器的工作原理、创建方法及使用场景，重点讲解了BEFORE和AFTER触发器...
Google Unveils AppFunctions to Connect AI Agents and Android Apps
In a move to transform Android into an "agent-first" OS, Google has i...
《红房间》让在线扑克与连环杀手一样刺激
这部电影缓慢展开，讲述了绑架、直播折磨和杀人影片的故事，意外地与在线扑克和比特币结合，探讨了痴迷、网络泡沫和媒体现象。

基于 Uniprot 开放数据集使用 Cytoscape.js 和 Amazon Neptune 图形数据库快速搭建无服务化蛋白质数据分析平台

内容提要

关键要点

标签

继续阅读