VLDB 2024 是数据管理和数据库领域的顶级国际会议,涵盖数据管理、数据库架构、图数据管理、数据隐私与安全、数据挖掘、机器学习、人工智能与数据库系统研究等领域。今年的会议于8月26日至30日在中国广州举行,汇集了全球的研究人员和企业。会议内容丰富,包括250多场研究报告、11场主题演讲、多个教程和workshop,为与会者提供了广泛的学习和交流机会。 最近去了趟广州,参加了 VLDB...
VLDB 2024将于2024年8月26日至8月30日在中国广州举行,会议涵盖了数据管理、数据库架构、图形数据管理、数据隐私与安全、数据挖掘、机器学习、人工智能和数据库系统研究等领域的问题。TiDB将有三篇论文和一个Demo Paper亮相,其中一篇论文介绍了AutoTQA,一个自主的多表格问答框架,另一篇Demo Paper介绍了OSSInsight,一个用于GitHub数据分析的开源工具,还有一篇论文介绍了StarBench,一种新型的星型模式基准测试。
hyper.ai在其官方网站上推出了一个名为“顶级会议”的新栏目,提供CCF A级计算机会议的最新信息,包括会议介绍、提交截止日期和提交链接。该网站还提供了一系列高质量的公共数据集、教程和社区文章。此外,hyper.ai还提供即将举行的会议信息,并定期更新内容。
hyper.ai官网上线了CCF A类计算机顶会信息板块,提供会议简介、截稿倒计时、投稿链接等,同时还提供优质公共数据集和教程精选。
2024年3月11日,一篇关于可组合数据管理系统VLDB的论文已发布,探讨了数据科学的发展和数据分析工具的演变,以及当前面临的挑战。文章介绍了一些与数据管理和分析相关的开源项目,如Apache Arrow、RAPIDS、DuckDB和Ibis等,致力于提高数据交换、查询执行和编程接口的模块化和互操作性。作者对未来的发展持乐观态度,并预测将出现新一轮的用户界面生产力投资浪潮。
华为云数据库团队发表论文介绍了其采用Shared-storage架构提高云原生数据库性能和稳定性的多主技术突破,经测试性能表现优异,采用VS时钟和混合行页锁技术,降低网络负载和提高性能。华为将于2023年9月20-22日在上海举办第八届华为全联接大会,以“加速行业智能化”为主题。
随着业务增长和云原生技术的发展,云原生分布式数据库产品不断涌现。字节跳动提出了CDSBen模型,利用机器学习预测存储层的IO pattern,实现真实的benchmark。CDSBen包括IOPS序列预测模型和联合分布预测模型,通过训练模型和改造后的YCSB工具进行基准测试。CDSBen的优势在于准确、灵活和易用。实验结果显示,CDSBen生成的读写请求性能更贴近真实业务流量。
阿里云操作系统团队、阿里云数据库团队和上海交通大学新兴并行计算研究中心联合撰写的论文“Async-fork”提出了一种解决IMKVS快照期间查询延迟大幅增加的问题的方法,将fork调用过程中最耗时的页表拷贝部分从父进程移动到子进程,并设计了一种主动同步机制,确保PTE在修改前被复制到子进程,实验结果表明,Async-fork显著减少了快照期间到达请求的尾延迟。引入双向指针,用于快速判断一个VMA的所有页表项是否已经复制到子进程,以及错误处理。
《Index Checkpoints for Instant Recovery in In-Memory Database Systems》是由华为云数据库创新Lab一作发表在数据库领域顶级会议VLDB'2022的学术论文。
云数据库实现计算存储分离,支持计算与存储的独立扩展,其用户还可以享受按量付费等特性。这使得基于云数据库的系统更加高效、灵活。因此,构建并使用云原生数据库的势头愈演愈烈。另一方面,云化存储服务已经是云的标准能力,存储侧提供兼容通用的文件接口,并且不对外暴露持久化、容错处理等复杂细节,其易用性和规模化带来的高性价比使得云存储成为了云上系统的第一选择。在通用云存储服务上构建云数据库,无疑是一种既能...
完成下面两步后,将自动完成登录并继续当前操作。