邮箱
科技云盘
科技云会
认证服务列表
学科资源
文档库
English
登录
资源与服务
通用分类
全部服务
计算服务
存储服务
网络服务
平台社区
科学软件
运行服务
数据信息
安全认证
云原生服务
学科分类
地球科学与环境科学
医学、生物学与生命科学
化学与物理学
空间科学与天文学
信息技术
工程技术
其他
开发者分类
中国科学院计算机网络信息中心
中国科学院高能物理研究所
中国科学院心理研究所
北京大学
复旦大学
哈尔滨工业大学
UIUC
华大基因
Argonne国家实验室
Mo人工智能俱乐部
NCSA
Google
更多
首页
管理与规范
加入规则
入驻协议
服务协议
标准规范
动态与通知
产品动态
通知公告
重大活动
项目与案例
重大科研项目
典型应用案例
开放科学案例
支持与服务
技术文档
技术追踪
会议资料
培训资料
年度用户培训
2023年在线培训
2024年在线培训
2025年在线培训
关于我们
中心概述
项目介绍
国际合作
大事记
联系方式
工作台
个人工作台
项目组工作台
服务
服务
软件
科普
数据
返回
OpsEval大语言模型智能运维能力评估网站
OpsEval是一个全面的大语言模型智能运维能力评估基准。
智能运维评估基准
大语言模型
科研工具
去使用
服务介绍
产品优势
产品功能
实战案例
技术支持
服务介绍
OpsEval是一个全面的大语言模型智能运维能力评估基准。
产品优势
全面性
OpsEval 数据集涵盖了 IT 运维(AIOps)领域的多种任务场景,包括故障根因分析、运维脚本生成、警报信息总结等,能够全面评估大语言模型(LLMs)在运维任务中的表现
任务导向
数据集提供了 7184 道选择题和 1736 道问答题,覆盖中英双语、8 种任务场景和 3 个能力分级,能够精准评估模型在不同任务和难度下的表现
前瞻性
基于 Gartner 对 AI 自动化 IT 运维趋势的预测,OpsEval 紧跟行业前沿,帮助用户了解 LLMs 在 AIOps 中的实际应用潜力
实用性
数据集专注于实际运维场景,能够为 IT 运维团队提供直接的参考,帮助优化自动化运维流程,提升效率
多语言支持
支持中英双语评估,满足全球化企业的多语言运维需求
产品功能
任务场景覆盖
1) 支持 8 种任务场景,包括故障根因分析、运维脚本生成、警报信息总结等,全面覆盖 AIOps 核心需求;2) 提供选择题和问答题两种题型,满足不同评估需求
多语言支持
支持中英双语评估,适用于全球化的 IT 运维环境
基准测试工具
提供标准化的评估工具,支持用户快速导入模型并生成评估结果
实战案例
评估通用大模型智能运维能力
发现领域大模型薄弱点,有针对性进行优化
技术支持
联系人:于优美
电 话:17813067570
邮 箱:ymyu@cnic.cn