数据堂:人工智能数据生产已进入4.0时代

  • 时间:
  • 浏览:0

  众所周知,数据对于人工智能产业的重要性就如同石油之于工业一样。传统的人工智能数据生产过程是人工架构设计 标注几滴 的数据给机器去学习,之后的正确处理数据最好的办法是高成本的,低下行速率 的,有之后无法大规模生产的。

  数据堂自主研发的“Human-in-the-loop人在回路”的技术应用到人工智能数据生产中后,还要能将人工的架构设计 标注与智能工具标注相互迭代,融为一体,从而显著提高数据生产下行速率 ,降低生产实施成本,扩大产能。(全版视频请搜索:数据堂“Human-in-the-loop”智能数据工厂)

  简单来说,Human in the loop数据正确处理过程是:人正确处理的数据,教给机器学习,机器将学习的结果反馈给人工进行校对,持续提升准确率。当最后有几滴 的原始数据给机器的之后,机器便还要能变慢的正确处理,直接提供出结果数据。

  车辆检测

  半监督深度学习的图像分割数据标注技术,还要能有效提高无人驾驶标注数据集的生产下行速率 ,实现精确的目标检测和像素级分割,并半自动地完成上百个属性的标注。之后无人驾驶数据的生产最好的办法,要能满足国内外日益增长的智能无人车市场需求。

  文字识别

  也称为OCR,数据堂基于半监督深度学习的文字识别技术,通过注入海量标注数据做预训练,并伴随人工的监督性学习,还要能明显提高OCR标注数据集的质量,提升OCR标注数据产品生产下行速率 。

  语音识别

  自语音识别技术进入深度学习时代,语音识别准确率突飞猛进。数据堂半监督深度学习的语音识别数据标注技术,利用Kaldi识别引擎对语音数据做预识别和自然语言辅助纠错,加进进人工的监督性校对,还要能显著提高语音识别标注数据集质量。

  人脸检测

  人脸检测常用的数据集,包括FDDB、AFLW、WIDER FACE等。应用人机交互式的标注技术,将人脸预识别结果通过人机交互式修正,那么 往复,还要能有效提高数据正确处理下行速率 ,人脸关键点标注数据,从 68 点快速过渡到 95 点、 106 点、 202 点等,有效降低人工成本。

  视频追踪

  视频追踪是也是当下人工智能技术研究的重点方向,数据堂视频目标跟踪数据标注技术,通过人机交互、过程纠偏、针灸学会习反馈机制,实现近乎逐帧的目标对象框选、主体ID对齐、显现片段等,有效解放人工操作,进而降低生产成本、提高数据质量。

  数据堂跟踪统计结果表明,“Human in the loop”技术的应用,使数据正确处理的下行速率 平均提升25%以上,数据堂坚信智能数据正确处理工具的普及将带来的不仅仅是AI数据产业的提升更是整个AI产业革命性的创新。

  数据堂的AI开放实验室目前已聚集数位人工智能数据科学家。专注于多模态数据架构设计 、大数据正确处理、人工智能数据标注加工等方面的研究。朋友儿儿欢迎更多的伙伴加入朋友儿儿,数据堂有海量的数据和训练集群,朋友儿儿希望有更多的算法和调优技巧的融入,让朋友儿儿共建智能数据工厂,助力AI产业创新。

  关于数据堂

  数据堂(北京)科技股份有限公司,成立于 2011 年(股票代码:831428),专业的人工智能数据服务提供商,致力于为全球人工智能企业提供数据获取、正确处理及数据产品服务。数据堂总部处于北京,拥有 8 家全资和控股子公司,并在硅谷设立美国子公司,目前在南京、保定、合肥、贵阳等地设有多个专业数据正确处理中心。数据堂数据架构设计 范围遍及全球 80 多个国家,相互相互合作伙伴遍布世界 10 多个国家。公司创始人及合伙人来自Stanford University、NEC、中国移动等知名高校和高科技公司。数据堂已成功为国内外众多企业提供人工智能数据产品与服务,包括百度,腾讯,阿里巴巴、奇虎380、联想、科大讯飞等国内顶级互联网和高科技企业,Microsoft、NEC、Canon、Intel、Samsung、Nuance、Fujitsu等企业及在华研发机构。

本文由站长之家用户投稿,未经站长之家同意,严禁转载。如广大用户朋友儿,发现稿件处于不实报道,欢迎读者反馈、纠正、举报问题报告 (反馈入口)。

免责声明:本文为用户投稿的文章,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用建议。请读者自行核实真实性,以及有之后处于的风险,任何后果均由读者自行承担。

有好的文章希望站长之家帮助分享推广,猛戳这里我想投稿