HI,下午好,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-302
请扫码咨询

新媒易动态

NEWS CENTER

在人工智能产品构建过程分为很多阶段,从最顶层的商业思考到下层的模型研发都有着不同的思考方式

2020-06-23

在人工智能产品构建过程分为很多阶段,从最顶层的商业思考到下层的模型研发都有着不同的思考方式。

第一阶段是商业模式设计,任何产品早期都会对商业模式进行细致的考虑,商业模式的设计牵扯到方方面面,我们需要重点突出产品的行业属性与产业价值。

第二阶段是数据洞察与业务转化,我们需要去收集有意义的数据并将转化为模型的输入。

第三阶段是产品建模与评估,需要前两阶段的准备对产品模型进行开发与测试。


(1)行业洞察:首先对行业需要有深刻的理解与洞察。

(2)价值分析:针对于产品具体分析给用户带来什么价值,什么样的价值能够使用户认可。需要以用户的视角来分析产品的价值所在。

(3)数据分析:针对行业的特点分析数据应如何整理,如何利用,如何构成产品。

(4)资源评估:评估是否有足够的数据与人员支持人工智能产品的开发。

(5)资源收集:通过各种渠道购买、收集数据,以及各类人员的资源分配。

(6)设计研发方案:根据以上结论设计人工智能产品的模型搭建与评估方案。

一、深度挖掘行业,探究产品价值

1. 深刻挖掘行业属性

当前产业互联网恰逢其时,AI技术也更多的应用于行业之中。我们开发人工智能产品首要问题就是需要深刻理解行业痛点,做出有价值的产品。如何了解一个行业也有一些实用的方法可以借鉴。

构建产品之初首先需要充分了解这个行业,而且也要充分了解自己。了解自己主要从自身的所学专业、兴趣程度、个人性格等方面综合考量。当今社会所做的行业与自身专业不匹配的状况时有发生,只有充分认识自我并且充分认知行业,才能做出成熟的判定。我们先不谈对自己的了解,首先给出如何快速认识一个行业的切入路径。


第一步:行业认知——行业分解认知、行业组合认知

第二步:行业分析——业务流程、产业链、商业模式

第三步:行业常识——业内典型企业与领导者

对于行业切入路径仍然需要作一些说明,这个方法只是一个初步了解行业的路径。由于大家教育背景不同专业不同,各个行业壁垒有有高有底,并不要指望通过某个方法就能够立刻深入到某个行业中,想真正深入某个行业还需要系统的学习行业知识,并真正在行业中沉淀一段时间,才能够深入体会。

行业认知是切入行业的第一步,在行业认知的过程中分为2个步骤:行业分解认知与行业组合认知。

(1)行业分解认知

研究某个行业不能囫囵吞枣,首先要对行业进行分解。所谓行业分解认知是将行业细分成一个个子领域,针对这些子领域再进行一一分析的过程。对于一个未细分的行业是无法拿来研究的,只有将其分解才能各个击破。用大家熟悉的互联网产品经理来举例,现在产品经理行业也产生了很多子领域,包括数据产品经理、后台产品经理、人工智能产品经理等。尽管这些产品经理在职能方面可能有所交叉,但是分解的越细代表对产品经理这个行业了解的越深入。


(2)行业组合认知

在行业分解认知之后,我们已经对行业有了一个初步的了解,之后我们需要通过行业组合认知对行业进行综合分析。行业组合认知是指将之前行业分解得到的子领域,统一回归到整体行业的框架下思考,思考的重点是每个子领域对整体行业的贡献,以及研究各个子领域在产业中的关系与地位。因此,分析好每个细分子领域对行业整体的贡献,才能更加透彻地审视全局。

2. 探究产品价值

无论何种产品都必须要体现价值才能赢得商业,AI产品当然更是如此。对于一个成功的AI产品,并不是重视其使用了多么先进的AI技术,而是通过技术能否真正得到行业价值。

例如,在过构建工业知识图谱时,如果只强调知识图谱可以将不同的知识连接起来,则不能突出其价值。工业知识图谱真正的价值根据不同项目,概括为在生产产生偏差时,快速寻找到相关原因。或将所有工序文件相关联,确保生产过程的合规性检查。产品的价值必须符合行业属性,并使用户有清晰的辨识度。

针对产业互联网而言,产品价值主要体现以下2个方面。

(1)效率价值

人工智能技术应用于产业,最重要的一点就是提升产业效率。人工智能技术是对人的模仿技术,人工智能产品可以提供某个工序的工作效率,降低人员的参与程度,降低人员成本,提高工作准确率。

(2)创新价值

在效率产生大幅度提升时,则意味着创新。但是创新并不是仅仅是通过效率提升而产生的。随着人工智能技术的发展,大规模逻辑网络的形成,知识图谱的大规模应用,已经能够运用此类技术构建新知识新发现。

人工智能产品的研发,首先可以先以实现效率价值为目标,在逐步实现创新价值。需要以行业诉求为最终的价值判别依据。

二、数据洞察与处理

1. 需求与数据

当今是一个数据爆炸的时代,数据积累的规模远远超过了之前人类社会数据积累规模的总和。在大数据这个概念出现之前,计算机并不能很好的解决需要人去做判别的一些问题。如今人工智能利用用大量的数据作导向,能够使机器完成一些之前机器所不能完成的功能,使之前无法满足的需求得以满足。人工智能技术离不开数据,数据与需求之间首先应该搭建起一个桥梁。

(1)从数据到需求

我们首先将经历聚焦到数据上来,认真分析这些积累下来的数据都有哪些?思考这些数据都能够做些什么?哪些与我们的业务关联性高,哪些关联性低?例如一个外贸公司积累了之前5年的销售流水数据,那我们可以考虑用这些数据推测第六年的销售流水。从数据到需求的阶段,我们只需要考虑数据能够做什么,暂时无需考虑数据的产出是否与业务相关。

(2)从需求到数据

当我们完成对数据的聚焦后,开始对需求进行聚焦。对需求的聚焦需要分析业务,重点分析的内容是满足这些需求都需要哪些数据来支撑。满足一个业务需求,可能需要很多数据支持,这些数据有些已经被积累,有些则没有被积累。

例如一个外贸公司需要预测下一年的销售额,需要前10年的公司销售额,除此之外还需要上一年股市大盘的走势数据,同时也需要公司前5年的用户数据。从需求到数据的过程是为了使公司清楚针对某一个特定需求,哪些数据已经保留,哪些数据需要外购,哪些数据在以后的公司发展中需要保留下来。

首先从数据到需求,再由需求到数据。数据与需求是一个相互渐进、反复循环的过程,如图所示。从数据到需求是一个数据价值提升的过程,这个过程首先数据赋予了价值;从需求到数据是一个数据升级的过程,更多围绕需求的数据被挖掘,也更加明确了数据与需求的联系。


数据的来源主要有2种方式,可以自己采集也可以购买。采集来的大多是用户与业务数据,这部分数据可以用来完善产品或者制作数据分析报告;购买的标注数据可以作为训练集,用于构建模型。

对于非监督学习可以使用未标注过的训练集进行训练,不过在实际真正的产品构建中,大家应尽量少的使用非监督学习。非监督学习学习效率较低,无法快速得到较好的模型效果,产品也就无法落地实用。非监督学习可以更多的应用于科研或者课题研究方面。

2. 数据标注

数据质量是影响人工智能产品准确性的关键所在,一个具有高质量标注的数据集对于模型的提升效果,远远高于算法优化带来的效果。数据标注是通过人工或半自动的方式,将原始数据打上相应的标签,打好标签的原始数据称为标注数据或者训练集数据。


相关推荐