K体育世界杯中国官网首页 黄宇凯:推动供需协同 建立高质地数据集

海天瑞声CTO黄宇凯。东说念主民网记者 翁奇羽摄
东说念主民网自贡6月17日电 (记者焦磊)6月16日,由东说念主民网驾御的2026东说念主民数据大会在四川省自贡市举行。海天瑞声CTO黄宇凯在主旨发言中暗意,高质地数据集是东说念主工智能模子技艺栽培的紧要基础,鼓励高质地数据集建立,需要从总体主意、工程化建立、质地评测和产业生态等方面协同发力。
黄宇凯暗意K体育世界杯中国官网首页,高质地数据集可径直用于开拓和试验东说念主工智能模子,是能有用栽培模子性能的数据辘集,具有范围大、质地高、安全牢、不雅点正、搁置好、应用广等中枢特色,是大模子技艺的基础,也决定了模子技艺的上限。
黄宇凯以为,高质地数据集建立应罢黜“总体主意、分步实施,先易后难、先简后繁”的原则。他暗意,数据是东说念主工智能的要道基石,也关系企业和组织里面多部门、多系统协同,需要顶层谋略和换取。
开云体育(kaiyun)官网关于围绕建立旅途,黄宇凯暗意,高质地数据集建立需要从供给侧和需求侧两个地点发力。从供给侧看,应站在数据家具和数据劳动角度,在数据出产、数据搞定、数据供给等方面加大参加;从需求侧看,则应站在东说念主工智能赋能各行业、各场景落地的角度,以应用需求牵引数据建立、开释数据价值。两者之间,K体育世界杯中国官网首页需要通过数据本事、数据劳动和数据生态协同供需两头,促进东说念主工智能产业高质地发展。
信得过数据空间建立与行业高质地数据集建立密切关联。对此,黄宇凯暗意,围绕国度数据局鼓励的信得过数据空间,不错从个东说念主、企业、行业、城市、跨境等不同层面伸开,字据不同信得过数据空间面向的应用场景,需要数据提供方、使用方、劳动方、运营方和监管方等多方共同参与。
黄宇凯先容,在文旅行业,海天瑞声也在多个景区推动多模态伴游助手应用,哄骗景区文本、图片、视频等数据,纠合具体应用场景打造文旅行业高质地数据集,推动导览劳动从被迫反应向主动劳动、从通用谜底向深度体验滚动。在数字东说念主边界,围绕直播带货、品牌宣传、动画游戏、文化推行等不同场景,也存在文本、声息、视频等多模态定制化数据需求。
据先容,海天瑞声建立于2005年,长期专注于东说念主工智能高质地数据集技艺建立和家具劳动,已累计变成1800多个数据集,劳动大家逾越1200家客户。
黄宇凯暗意,纠合东说念主才资源、数据资源和工程化、范围化智能平台技艺,捏续构建高质地数据集,将有助于东说念主工智能更好赋能千行百业。