(资料图)
同花顺(300033)金融研究中心3月14日讯,有投资者向中文在线(300364)提问, 中文公开语料不足英文的十分之一,这成了中文CHATGPT的痛点,作为中国最大的正版数字内容平台之一,中文在线在过去23年历史中,每天产生数以亿计文字内容。这成了重要的稀缺资源,中文在线将如何在CHATGPT大潮中出让这23年的积累发挥作用?谢谢
公司回答表示,尊敬的投资者,您好:在AI领域3大核心是数据、算力、算法,数据对于如ChatGPT等AI模型的意义重大,高质量的数据资源可让数据变成资产、变成核心生产力,AI模型的生产内容高度依赖源头数据。公司深耕文化数字产业20余年,拥有海量的正版中文数据资源,公司在数据的优势有4个:第1个是海量,公司拥有的中文文字字数超万亿字,内容品类包含小说类、科普类、社会类、经管类、法律类,教育教材类等等;第2个是高质量,公司拥有的数字内容经过市场长期校验,已形成高质量的数据内容库,而高质量的数据可大幅提升模型训练效果,缩短学习时间和提升学习质量,让AI模型产出内容稳定;第3个是正版版权,公司自成立之初一直秉承“先授权、后传播”的原则,高度重视知识产权保护工作,拥有旗下数字内容从数字版权到全部版权的权利,可为AI模型公司提供拥有版权的数据集用于训练;第4个是完整的各类型商业生态链,如公司拥有网络原创驻站作者440余万名,可实时反馈最新数据,提供最贴近市场和用户的最新数据,让AI模型持续更新学习。未来,公司也将充分发挥公司的数据优势,持续为行业赋能。
点击进入互动平台 查看更多回复信息
标签:
[ 相关新闻 ]
2022-08-08 11:04:18
2022-03-18 15:03:32
2022-03-18 15:01:59
2022-03-18 15:00:36
2022-02-07 16:16:27
2022-02-07 16:16:27
2022-02-07 16:16:27
2022-02-07 16:16:27
2022-02-07 16:16:25