2025中国生成式AI大会由智猩猩、智东西共同发起。澳鹏Appen携全面的大模型数据解决方案亮相大会,展示了如何以专业、精准、安全的高质量训练数据赋能大模型开发,特别是在垂直领域的深度应用。澳鹏展位吸引了众多参会者驻足交流,尤其是来自金融、医疗、法律等垂直行业的专业人士。
在大模型峰会上,澳鹏Appen中国及韩国区副总裁董成发表了题为《大模型时代的AI数据服务》的主题演讲,通过澳鹏在各领域大模型部署中的数据训练最佳实践,分享了对大模型应用趋势的深刻观察。
在演讲中,董成系统介绍了澳鹏全面的大模型数据解决方案,覆盖从通用能力到垂直领域的全链条数据需求,包括:
全面的大模型数据生产工具链:澳鹏开发了覆盖文本对话、图像/视频描述、多模态融合、思维链和工具调用等场景的专业数据生产工具,满足大模型训练对多样化数据类型的需求。
智能体训练数据生产:针对快速发展的AI智能体领域,澳鹏专门开发了针对GUI Agent的数据解决方案,支持智能体在多步骤任务中的数据训练需求。
自动化数据标注回环:澳鹏采用“以AI赋能AI”的开发策略,通过自研的预标注大模型与不同领域项目实践相结合,构建了自动化数据标注回环系统,大幅提升数据生产效率。
高质量成品数据集:澳鹏提供大规模、高质量、多模态的成品数据集,包括多模态多步骤思维链数据集、千万级多语种平行语料数据集、千万级知识百科和垂类问答数据集、千万级代码数据集、亿级高质量学科题目数据集以及百万级图像文本多模态数据集等。这些数据集为大模型的快速迭代提供了丰富的数据养料。
微信关注 今日中国
微信号
1234566789
微博关注