一、大采集:全方位收集信息
数据采集系统是结合基于计算机的测量软硬件产品来实现灵活的、用户自定义的测量系统,由信号、传感器、激励器、信号调理、数据采集设备和应用软件等组成。“大采集”就是全方位、全系统、全过程、全手段的数据采集。
大采集的内容主要有:
物理信号采集:主要通过各种物理信号传感器测量电压、电流、温度、湿度、压力、水流、光线、色彩或声音等单一物理现象。
图像信号采集:主要通过摄像头采集人的面部、身体、指纹、符号、图片、光线、色彩等信号。
声音信号采集:主要通过话筒采集声音、语音等信号。
空间信号采集:主要通过卫星定位系统测量人或物的空间位置与地理环境。
时间信号采集:主要通过时钟来测量人或物进行运动与变化的时间点、时间间隔等信号。
行为信号采集:主要通过电脑(包括键盘、鼠标)等采集人的生活行为、工作行为或网络行为。
二、大识别:智能识别信息模式
模式就是事物的规范化、标准化的形式。模式识别就是对于事物的规范化、标准化的形式识别。“大识别”就是全方位、全系统、全过程、全手段的模式识别。
大识别的内容主要有:
1、图像模式识别。包括图片识别、符号识别、脸谱识别、指纹识别、商品识别、物体识别、票证识别等内容。
2、语言文字识别:主要是汉字手写体的识别和自然语言识别。
3、语音识别:包括对于重音、音调、音量和发音速度等方面的识别。
4、专家诊断:包括医学诊断(如心电图诊断和脑电图诊断等)、机械故障诊断、电子故障诊断、网络故障诊断等。
5、专业分析:包括光谱分析、地质分析、气象分析、水文分析、农作物估产、病毒分析等。
6、行为模式识别:包括人的各种生活行为模式、工作行为模式或网络行为模式,如网络上的点赞、视频播放、转发、分享、打赏、评论、问卷、查询、网上交易等行为模式。
三、大计算:建立所有事物的数据库
根据大采集和大识别以后所产生的海量数据进行系统性计算,从而形成人或电脑对于各种事物及其属性的系统性认知。大计算就是全方位、全系统、全过程、全手段的数据计算。主要包括计算各个事物之间的数量关系、时间关系、空间关系、逻辑关系、图像关系、声音关系、气味关系、运动关系等内容,并以此建立各种事物的大数据库。
四、大提取:特征工程提取心智参数
相同的事物在不同环境条件下,对于不同的人具有不同的价值特性。因此人对于相同的事物往往表现出不同的价值取向、情感态度、心智特征。
人的一切行为都是围绕价值为核心而展开的,而人的行为又是在人的主观意识的作用下实施的,这样一来,可以把人对于客观事物的作用过程分解为两个向量空间:一是心智向量空间,二是行为向量空间。显然,这两个向量空间之间存在着一定的关联性与对应性。
特征工程:就是将某种特征向量空间的原始数据映射到另一种特征向量空间的方法与技术。
“大提取”就是根据人的各种行为参数或在网络系统中的各种网络数据(如点击网页、文章发表、点赞、视频的播放、转发、分享、打赏、评论、问卷、查询、朋友圈、购物、聊天记录等,通过“特征工程”来提取人的兴趣爱好、情感取向、性格特征、宗教信仰、政治观点、婚恋状态等心智特征参数。