在此特邀嘉宾中,Bottos的联合创始人兼首席执行官宋欣指出,如果人工智能是未来几年推动创新的引擎,那么数据就是人工智能的动力。然而,数据的成本和可用性都是许多中小型公司难以克服的障碍。Bottos是服务于AI的公共区块链。宋与Bottos团队合作推动人工智能创新,最终创建一个全新的分布式AI生态系统。他在企业数字化的投资,战略和重组方面拥有13年的经验。
如果人工智能是未来几年推动创新的引擎,那么数据就是人工智能的动力。很显然,数据的成本和可用性都是许多中小型公司难以克服的障碍。
根据Brookings Institute的报告,充分利用人工智能项目的关键是建立一个“数据友好型生态系统,统一标准和跨平台共享”。该报告补充说,可供探索的数据集是成功开发AI的先决条件。
对于看似预算无限的科技巨头而言,数据采集不是问题。不过,小型公司的情况并非如此,特别是当数据成本占据项目预算的50-60%时。
由于预算限制而缩减用于训练模型的数据量是被逼无奈的选择,因为这会导致与期望背道而驰的结果。AI不会推断出结论,它通过反复试验来学习——这需要大量的数据。
缺乏足够的数据可能导致训练不足的模型。MIT Media Lab的一名研究人员使用了1,270张面孔的数据集来测试三种不同的面部识别系统,并发现了基于种族和性别的重大错误识别问题。
为了减少,甚至消除人们对面部识别技术的偏见,IBM最近宣布将发布两个数据集。一个数据集包含超过一百万个图像(比当前可用的最大数据集大五倍),另一个数据集按照肤色,性别和年龄细分成了36,000个图像。
市面上有几家初创公司,已经开始提供专门用于可使用、可访问的数据。为了平衡中小型公司的竞争环境,它们建立了分散的全球数据市场。这些基于区块链的市场将汇集数据供应商和买家。有些人预测,在某些情况下,市场可以将数据的成本降低至30%。
改善数据可用性的另一个途径是建立志愿者社区,里面的人很需要包括面部图像在内的数据。比如利用游戏来使收集数据变得有意思、有吸引力,并给予贡献者相应的奖励。
当下,面部识别技术飞速发展。例如,奥兰多国际机场将成为第一个实施生物识别进出口计划的机场,利用面部识别技术为国际乘客提供服务。亚马逊正在与多家执法机构一起测试其“识别”系统。
NewVantage Partners的一份报告“大数据和人工智能如何推动业务创新”表示,“人工智能计划直接受益于更丰富,更精细,更完整,更广泛的数据 ——在更大的数量,种类和数据来源中。”
该报告还提出,大数据和人工智能投资水平增长的促成因素之一就是数据量的增加和赋能人工智能的资源。通过对CEO的调研发现:75%CEO认为访问更多更大的数据集有助于推动人工智能。
为了使AI充分发挥其潜力,数据的“燃料”需要变得更加实惠,这样一来,中小型公司就能够负担。
Good to Know
Bottos是聚焦于人工智能领域的基础设施,既有依据数据特性而专门设计的底层公链,又有服务于整个人工智能及其衍生产业的数据流转平台。通过数据挖矿和智能合约实现数据、模型、算力、存储多层级共享服务的基于共识的、可扩展的、易于开发的和可协同的一站式应用平台。
【Bottos社区入口】
BBS: www.botfans.org
Twitter: twitter.com/bottos_ai
Telegram: t.me/bottoscn
Medium: medium.com/bottos
FB: www.facebook.com/bottos.org
GitHub: github.com/Bottos-project