千万级信息图表数据集,助力图表理解与生成领域突破
• 覆盖115万+合成与10万+真实信息图表,囊括75种图表类型、330种视觉变体及68种布局模板
• 数据来源广泛,采集自Pinterest、Visual Capitalist、Statista等19个权威图表网站
• 合成图表通过程序化生成,基于详尽的视觉元素和空间布局规则,确保多样且高质量
• 应用场景丰富:
– 提升基础模型对信息图表的理解能力,附完整训练与评测代码
– LVLM代码生成基准,精准评估D3.js图表渲染的视觉相似度,支持高低粒度对比
– 示例驱动的图表生成方法,能根据样例图表风格将用户表格数据转化为美观信息图
• 数据集及相关代码均开源,采用Apache 2.0协议,便于科研与产业应用
• 最新数据发布:2025年6月新增23万+合成图表,整体规模达44万种变体
ChartGalaxy | #数据集