“数据标注是机器感知现实世界的起点,是大部分人工智能算法得以有效运行的关键环节。”百度智能云数据标注基地业务产品负责人胡驰说,简单来说,数据标注是对未经处理的语音、图片、文本、视频等数据进行特征标签,将非结构化的数据转变为机器可识别的结构化数据,使机器通过大量学习这些数据,化“人工”为“智能”。
数据标注师是伴随人工智能发展诞生的新职业,人工智能的进步离不开数据的标注。随着中国人工智能产业的高速发展,数据标注师这个新职业的需求及人数也在壮大。作为人工智能的“启蒙老师”,数据标注行业流行着一句话,“有多少智能,就有多少人工”。
目前,数据标注不仅服务于自动驾驶行业,还服务于医疗保健、智能安防、新零售等场景。
帅双双是一名医疗数据标注师,他的工作主要是对医疗类问答进行标注,纠正生成式人工智能对医疗相关问题的解答,主要用于在线问诊等场景。他介绍说,“比如向AI提问心脏病的并发症有哪些,我们要从它的多个回答中标注出符合问题的选项。有时,AI的回答虽然正确,但是语句不通顺、不清晰,我们也要对此进行标注,通过这些操作,综合培养AI的回答系统。”
AI技术的落地应用在很大程度上缓解了医疗资源紧张、地区分布不均等问题,提升了医疗体系的整体运行效率。数据标注有望在增强人工智能在医疗保健领域的应用方面发挥重要作用。
胡驰表示,目前,人工智能技术不断演化、技术与行业场景融合不断泛化,这些都需要大量的数据支撑,会对数据产生许多新的需求。数据标注也从早期的相对通用数据向专业化、复杂化方向演进。越来越多的细分场景,需要更多定制化模型进行迭代训练,这也让数据标注师面临更多考验,“未来,数据标注师会伴随人工智能的发展不断成长与变化,具备较长的职业生命周期与上升空间。”
看法:随着数据行业的发展,未来行业的门槛会越来越高。人工智能应用场景在不断细分,数据分类也更加精细化、复杂化,作为数据标注师必须不断学习以满足行业发展需求。
網址:https://www.chinanews.com.cn/cj/2023/08-22/10064943.shtml
数据标注师是伴随人工智能发展诞生的新职业,人工智能的进步离不开数据的标注。随着中国人工智能产业的高速发展,数据标注师这个新职业的需求及人数也在壮大。