科学地平线(SciHorizon)
科学地平线(SciHorizon)平台由中国科学院计算机网络信息中心牵头建设,专注于面向科学领域的高质量数据与人工智能大模型的评价与应用研究。在人工智能赋能科学研究(AI4Science)的时代背景下,平台围绕“大模型科学领域能力”和“AI-Ready科学数据质量”两个核心方向,构建了综合性评价体系和权威评估基准,力争打造人工智能时代技术赋能科学的磨刀石,形成促进学科发展和技术创新的助推器。科学地平线平台也是国际首个从“数据+模型”角度,面向AI4Science的综合评价平台。
人工智能赋能科学研究AI4Science大模型科学领域能力评估高质量AI-Ready科学数据推荐
服务介绍

科学地平线(SciHorizon)平台由中国科学院计算机网络信息中心牵头建设,专注于面向科学领域的高质量数据与人工智能大模型的评价与应用研究。在人工智能赋能科学研究(AI4Science)的时代背景下,平台围绕“大模型科学领域能力”和“AI-Ready科学数据质量”两个核心方向,构建了综合性评价体系和权威评估基准,力争打造人工智能时代技术赋能科学的磨刀石,形成促进学科发展和技术创新的助推器。科学地平线平台也是国际首个从“数据+模型”角度,面向AI4Science的综合评价平台。

产品优势
综合性评价体系
科学地平线(SciHorizon)平台是由中国科学院计算机网络信息中心研发的国际首个面向人工智能赋能科学研究(AI4Science)的评价平台,分别围绕"大模型科学领域能力"与"AI-Ready科学数据质量"两个方面构建了综合性的评价体系,为科学创新提供权威评估基准,力争打造人工智能时代技术赋能科学的磨刀石,形成促进学科发展和技术创新的助推器。
产品功能
大模型科学领域能力评估
科学地平线(SciHorizon)平台针对"大模型科学领域能力"与"AI-Ready科学数据质量"两个方面构建了综合性的评价体系。其中,面对大模型科学领域能力评估,围绕知识、理解、推理、多模态、价值观五大核心能力指标,构建知识真实性、科学事实理解、数值推理、科学图标理解、遵循学术诚信等十六项能力评估维度,实现对国内外代表性开、闭源大模型进行综合性评估。
科学数据质量评估
面对AI-Ready科学数据质量,从规范性、可用性、可解释性、合规性四个方面十五个子维度进行综合评估,在确保数据高质量的前提下,强化了数据的语义丰富性与机器可操作能力,并给出应用场景推荐。
实战案例
模型评测
模型评测方面,科学地平线平台对Deepseek-R1、QwQ-32B等大模型在数学、物理学、化学、生命科学、地球与空间科学领域进行了系统化评测,结果显示DeepSeek-R1领跑综合评分,在推理、知识和价值观维度表现均衡,Gemini-2.0-Pro(68.02)和DeepSeek-V3(67.29)紧随其后。
数据评测
数据评测方面,科学地平线平台针对地球科学、生命科学、材料领域的高影响力数据集进行了综合评估,并给出了推荐榜单。
技术支持
联系人:秦老师
邮   箱:scihorizon@cnic.cn