坚固耐用的低成本相机的广泛使用性为研究人员监测世界偏远地区的野生生物种群带来了福音。但是检查摄像机镜头需要花费时间,而且只有这么多人可以做,这通常会给保护社区造成盲点。
DeepMind LLC相信人工智能可以提供解决方案。今天,Alphabet Inc.表示正在研究使用机器学习来跟踪坦桑尼亚塞伦盖蒂国家公园中的动物。
该计划是DeepMind与该地区许多生态学家和保护主义者之间的合作。它建立在将近十年前启动的动物跟踪计划的基础上,当时一个狮子保护组织在整个国家公园内设置了数百个运动触发的摄像头。研究人员使用这些相机拍摄的照片来研究大型哺乳动物物种的行为,地理分布和种群数量。
挑战在于,图片中的动物必须手工仔细标记,以使数据具有科学价值。由于图像量大且人手不足,从拍摄标本到人类添加必要的注释,最长可能需要12个月的时间。
DeepMind建立了机器学习模型,该模型可以将等待时间缩短多达9个月。 AI不仅具有检测和识别照片中动物的能力,还可以同时对它们进行计数。DeepMind说,尽管仍在进行中,但该模型已经能够对物种进行分类,其准确性与人类相当或更高。
使自动摄像头的镜头质量远远不够稳定的原因尤其令人印象深刻。DeepMind的研究人员在该小组的博客中写道: “相机陷阱数据可能难以使用-动物可能看起来不清晰,并且相对于相机可能处于许多不同的距离和位置。” 从某些角度来看,即使是人类,也难以准确地识别动物。
DeepMind通过在4,149个人注释图像集上进行训练来提高模型的准确性。这些照片来自在线众包门户网站Snapshot Serengeti,志愿者可通过该门户手动分类野生动物照片以帮助专家。鉴于DeepMind的模型已经可以与人类志愿者的准确性相匹配,因此该模型的未来版本可能会完全不需要手动注释。
目前正在准备在现场部署该软件。DeepMind的研究人员写道:“现场工作具有挑战性,并充满意想不到的危险,例如电源线故障,互联网访问受限或无法访问。” “我们目前正在准备在现场部署的软件,并在安全的硬件要求和很少的Internet访问中寻找安全运行我们的预训练模型的方法。”