Kaggle赛题解析:Benetech图表内容识别

比赛名称:Benetech - Making Graphs Accessible

使用 ML 从图形创建表格数据

比赛链接:https://www.kaggle.com/competitions/vesuvius-challenge-ink-detection

比赛类型:计算机视觉、图文描述

比赛背景

数以百万计的学生有学习、身体或视力障碍,无法阅读传统印刷品。这些学生无法访问科学、技术、工程和数学领域的大部分教育材料。存在使书面文字易于访问的技术。

比赛任务

本次比赛的目标是提取 STEM 教科书中常见的四种图表所代表的数据。您将开发一个在图形数据集上训练的自动解决方案。

  • Example - Vertical Bar

Kaggle赛题解析:Benetech图表内容识别

x,Alberta;Ontario;Quebec;P.E.I.,vertical_bar
y,62023;50355;56288;38621,vertical_bar
  • Example - Horizontal Bar

Kaggle赛题解析:Benetech图表内容识别

x,299;289;279;229;211;209;173;159;128;113;95;53,horizontal_bar
y,Dec;Nov;Oct;Sep;Aug;Jul;Jun;May;Apr;Mar;Feb;Jan,horizontal_bar
  • Example - Histogram

Kaggle赛题解析:Benetech图表内容识别

x,0;5;10;15;20;25,vertical_bar
y,2.0;3.0;4.0;7.0;9.0,vertical_bar
  • Example - Categorical X-Axis

Kaggle赛题解析:Benetech图表内容识别

x,Guest 1561;Guest 1562;Guest 1563;Guest 1564;Guest 1565;Guest 1566,dot
y,3;5;6;4;5;4,dot
  • Example - Line Graph

Kaggle赛题解析:Benetech图表内容识别

x,0;10;20;30;40;50;60;70,line
y,2.85532;4.85973;7.02666;9.41515;11.72693;14.44788;16.70328;19.50852,line

评价指标

预测由四种科学图形(或图表)表示的数据系列:条形图、点图、折线图和散点图。

使用Benetech Competition Metric评价:

https://www.kaggle.com/code/ryanholbrook/competition-metric-benetech-mixed-match

数据描述

本次比赛的数据集包括约65,000个综合注释的科学图形,分为垂直条形图、水平条形图、点图、折线图和散点图五种。

  • train/annotations/ 描述图形的注释
  • train/images/ JPG训练数据
  • test/images/ 测试数据
  • sample_submission.csv 提交格式文件

比赛赛程

  • 2023年6月5日:组队截止日期。
  • 2023年6月12日:最终提交截止日期。

赛题奖金

  • 第一名 - 15,000 美元
  • 第二名 - 10,000 美元
  • 第三名 - 8,000 美元
  • 第四名 - 7,000 美元
  • 第五名 - 5,000 美元
  • 第六名 - 5,000 美元

解题思路

赛题需要图表内容进行识别,并文字进行组织。因此赛题可以借助OCR和图片描述的模型,是一个复杂的视觉赛题。

【竞赛报名/项目咨询请加微信:mollywei007】

上一篇

英国美国未来5年本科留学申请趋势分析

下一篇

Edexcel爱德思Alevel考试详细介绍

你也可能喜欢

  • 暂无相关文章!

关注热点

返回顶部