社会计算创新大赛背景

社会计算创新大赛由中国人工智能学会和浙江省大数据发展管理局联合主办,CAAI社会计算与社会智能专委、浙江大学公共管理学院共同承办,旨在通过大赛推进数字政府建设,发挥数据的基础资源作用和创新引擎作用,支撑全省数字化改革。“大脑”建设是推动数字化改革不断走向纵深的“突破口”,大赛将聚焦“大脑”算法、模型等能力建设以及多跨场景应用方案设计,坚持数据赋能,强化实战实效,实现对浙江省数字化改革的有力保障,同时也期待大赛相关成果能够推进国家治理体系和治理能力现代化,为数字中国建设提供有力支撑。
CAAI-BDSC2023社会计算创新大赛在Momodel平台和算能云平台特设“算法与模型”赛道。

“算法与模型”赛道背景

BDSC2023采用Hackthon模式开展社会计算创新大赛,本届大会将继续组织Hackthon算法创新赛。本赛道将分为初赛、复赛和决赛三个阶段。在初赛阶段,为充分挖掘多学科交叉融合优势,发挥不同领域研究人员特长,初赛赛题包括双向障碍检测和社会关系抽取,参赛者任选其一。按照相关规则,从两个赛题赛道分别选择一定数量的优秀队伍进入复赛。复赛赛道与初赛赛道一致,选手需要在算能云空间平台上完成模型的转换和推理任务。按照相关规则,从两个赛题赛道分别选择一定数量的优秀队伍进入决赛。
决赛阶段:进入决赛的队伍,将邀请到大会现场参加决赛。决赛阶段将提供全新的竞赛题目(后续公布),并以Hackthon(总时长36个小时)的方式进行。大赛组委将现场评出优胜队伍若干,并颁发奖金。

时间安排
开放登录平台,开始比赛日 2023年4月15日
初赛比赛开始 2023年4月17日
初赛截止提交 2023年5月26日
复赛比赛开始 2023年6月1日
复赛截止提交 2023年6月20日
决赛名单公布 2023年6月25日
现场决赛评选并宣布结果、颁奖 2023年7月4日-9日
奖项设置
一等奖1名 奖金10000元
二等奖2名 奖金5000元
三等奖3名 奖金3000元
优秀奖9名 奖金1000元
注:获奖名额会根据参赛队伍情况进行调整,由评委会裁定,经评委会评选后确定最终获奖名单。

登录方式与入口

  1. 报名方式:登录Momodel官网,注册个人信息,报名参赛。个人报名信息要求准确有效,否则会被取消参赛资格。本赛事不收取任何报名费用。
  2. 竞赛合作渠道主要包括:
    算能官网:www.sophgo.com
    微信公众号:SOPHGO算能
    企业微信群:添加“工作人员微信”进群
    3 报名成功后,初赛阶段参赛者需要在Momodel平台上进行模型训练和测试,并最终在平台提交结果。复赛阶段参赛者需要在算能云空间平台上进行模型的转换和部署,并最终在平台提交结果。决赛阶段将以Hackthon的形式组织在线下举行。

初赛题1:双相障碍检测

任务描述--
双相障碍属于心境障碍的一种疾病,英文名称为 Bipolar Disorder(BD),别名为 Bipolar Affective Disorder,表示既有躁狂发作又有抑郁发作的一类疾病。目前病因未明,主要是生物、心理与社会环境诸多方面因素参与其发病过程。当前研究发现,在双相障碍发生过程中遗传因素、环境或应激因素之间的交互作用、以及交互作用的出现时间点等都产生重要的影响;临床表现按照发作特点可以分为抑郁发作、躁狂发作或混合发作。双相障碍检测,即通过医学检测数据预测病人是否双相障碍,或双相障碍治疗是否有效。医学数据包括医学影像数据与肠道数据。由于缺少医学样本且特征过多,因此选取合适的特征对双模态特征进行整合并训练合适的分类器进行模型预测具有较强的现实需求与医学意义。参赛队伍需要根据提供的数据集构建分类模型,使用算能MLIR开源编译器进行编译,提交编译后的bmodel文件、原始模型文件以及推理脚本代码。

任务目标--
本任务要求参赛队伍完成少样本、多特征下的监督学习。

评测指标--
最终成绩 = 准确率50 + 召回率30 + f1值*20
数据集描述
数据集包含两个模态,其中医疗影像数据共6670维,肠道数据共377维,样本数量39个。其中正样本标签为1,负样本标签为-1。

初赛题2:社会关系抽取

任务描述--
关系抽取是社会计算的重要课题,也是信息抽取的基本任务之一,同样也是研究社会运行规律的重要步骤。关系抽取就是从一段文本中抽取出符合要求的实体。关系抽取主要做两件事:识别文本中的subject和object(实体识别任务)和判断这两个实体属于哪种关系(关系分类)。同时关系抽取可以为知识图谱的自动构建、搜索引擎、问答等下游任务提供支撑。参赛队伍需要使用指定的预训练关系抽取模型及数据集,使用算能MLIR开源编译器进行编译,提交编译后的bmodel文件、原始模型文件以及推理脚本代码。

任务目标--
参赛队伍需从关系抽取预训练模型中选取最合适的模型进行编译,使用MLIR编译器将模型转换为bmodel,并添加前后处理程序,实现该模型的应用,能够正确地处理数据。

评测指标--
对测试集上参评系统输出的结果和人工标注的结果进行精准匹配,采用F1值作为评价指标。针对部分文本中存在实体别名的问题,使用百度知识图谱的别名词典来辅助评测。F1值的计算方式如下:
F1 = (2 P R) / (P + R)
其中,
P = 测试集所有句子中预测正确的个数 / 测试集所有句子中预测出的个数;
R = 测试集所有句子中预测正确的个数 / 测试集所有句子中人工标注的个数

数据集描述--
数据集包含事件抽取的中文信息抽取任务。

复赛题1:双相障碍检测

任务描述--
对于初赛题1中的双相障碍检测任务,参赛队伍需要在算能云空间平台上,使用算能MLIR开源编译器进行编译,提交编译后的bmodel文件、原始模型文件以及推理脚本代码。

任务目标--
本任务要求参赛队伍完成少样本、多特征下的监督学习。

评测指标--
评价指标分为两部分,精度分为综合成绩指标(与初赛题1一致),速度指标为处理完所有数据所用时间。

数据集描述--
数据集包含两个模态,其中医疗影像数据共6670维,肠道数据共377维,样本数量39个。其中正样本标签为1,负样本标签为-1。

复赛题2:社会关系抽取模型部署

任务描述--
对于初赛题2中的关系抽取任务,使用算能MLIR开源编译器进行编译,量化及调优,并将模型部署在算能云平台TPU上,测试其推理性能。

任务目标--
参赛队伍需从关系抽取预训练模型中选取最合适的模型进行编译,使用MLIR编译器将模型转换为bmodel,并添加前后处理程序,实现该模型的应用,能够正确地处理数据。

评测指标--
评价指标分为两部分,精度分为F1指标(与初赛题2一致),速度指标为处理完所有文本数据所用时间。

数据集描述--
数据集包含事件抽取的中文信息抽取任务。
欢迎大家踊跃参赛!

CAAI第八届全国大数据与社会计算学术会议
由中国人工智能学会主办、社会计算与社会智能专委、新疆工程学院共同承办的CAAI第八届全国大数据与社会计算学术会议(China National Conference on Big Data & Social Computing,简称BDSC2023)将于2023年7月7-9日在乌鲁木齐召开!该会议创建于2012年,旨在搭建全国大数据与社会计算学术交流平台,培育社会计算与社会智能学科发展,助力社会计算与社会智能领域人才成长。会议组织者社会计算与社会智能专委是学会下设的体现交叉学科特色的学术组织,其宗旨是建设“有仁、有信、有情”的学术共同体,现有委员九十余人,分别来自社会科学、复杂系统、计算机科学、地理信息系统等领域,2021年被评为学会优秀专委。

本次大会的主题为“数字化转型与可持续发展”,面向全球气候变化、疫情传播与多重不确定性的叠加等可持续发展挑战,立足全球数字化转型的治理与政策实践,通过跨学科交叉视野探索,通过数字化推动可持续发展的全球经验与中国智慧。本次会议面向全国开展大数据与社会计算领域的研究者征文,重点探讨数字型可持续发展的基础性、前瞻性和战略性理论、方法及其应用,探讨数字型可持续发展的若干重大命题,发掘数字型可持续发展的经验与规律,交流新思想、探索新方法、挖掘新趋势、展望新愿景。