首页 > 财富 > 正文
百度大脑竟然可以识别生病或未绝育的流浪猫,超强大脑开放24种全新能力
03-21 17:01:38 来源:上游新闻综合

在百度大脑首场开放日活动上,百度大脑宣布开放24种新的AI能力,在市政、物流、教育等行业有了更多落地方案。截至目前,百度大脑开放了158项AI能力,24小时快速集成,开发者数量超过100万。

百度大脑开源深度学习平台PaddlePaddle以及通用AI能力都进行了更新。其中,PaddlePaddle核心框架Paddle Fluid v1.3新增发布视频分类模型库,新增支持NLP语义表示BERT模型,提升分布式训练性能。目前,百度PaddlePaddle已对外开放超过50种经过工业场景验证的官方模型。比如,领邦利用PaddlePaddle,通过ICNet语义分割模型识别精密零件瑕疵,实现了零件自动分拣。

语音方面,百度大脑推出了语音识别极速版,搭载注意力(attention)模型的语音能力,百度方面称实现了更快的响应速度,相对识别准确度可提升15%。语音识别预置语义解析的预置场景由35个升级为51个。百度大脑即将推出几款新产品,包括语音识别自训练平台、远场语音开发套件和语音离线合成等产品。

视觉方向上,OCR、车辆分析、人脸人体、图像识别都有升级。比如,卡证OCR新增了户口本、出生医学证明、港澳通行证和台湾通行证四类新能力,可识别卡证总数达到9种。当用户对着户口本拍一张照片,系统就能根据字段进行结构化识别,然后反馈出信息页的出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码。

票据OCR和汽车场景OCR也分别新增了行程单、保单、通用机打发票、定额发票、车辆VIN码、机动车销售发票、车辆合格证等识别能力。目前,百度大脑OCR产品全系列可以识别类型多达34款。

人脸人体识别方向上,百度大脑此次发布了新能力人脸情绪识别,人脸检测关键点由72个增至150个,常见手势能识别种数也达到了24种。图像识别方向,百度大脑更新了红酒和地标识别两个新能力。车辆分析方面上线了车辆检测和车流统计。百度大脑还会陆续上线车辆属性识别、车辆外观损伤识别、人脸融合、手部关键点识别、更高精度的人像分割以及钱币识别等有趣有用的应用场景。

在市政、物流、教育等领域,百度大脑加持的产品有了更多落地的案例。比如,百度EasyDL与分形科技打造的智能垃圾桶已成功地落地海淀公园,可以对7种常见垃圾自动分类;在和德邦物流的合作中,百度EasyDL使用定制词法分析快递申请,一秒拆分姓名、电话、住址等信息;百度EasyDL还与中科院在珍稀鸟类识别项目上展开的合作。百度EasyDL利用图像识别技术协助专家们对动植物标本、照片进行快速鉴定,目前在700多种鸟类模top5上的识别准确率达到93.89%,非雀形目鸟类模型top5准确率达到95.79%。

值得一提的是,工程师用百度大脑动物识别技术和百度EasyDL设计出了智能猫窝,拥有“猫脸门禁”、“病猫识别”、“绝育识别”三大功能,能够帮助救助志愿者发现生病和未绝育的流浪猫。

综合自界面新闻等

【免责声明】上游新闻客户端未标有“来源:上游新闻-重庆晨报”或“上游新闻LOGO、水印的文字、图片、音频视频等稿件均为转载稿。如转载稿涉及版权等问题,请与上游新闻联系。

  • 头条
  • 重庆
  • 悦读
  • 人物
  • 财富
点击进入频道

本周热榜

汽车

教育

美家

楼市

视频