首页 > 最新动态 > 实务解析 | 基于知识图谱的招标大数据分析研究
最新动态
实务解析 | 基于知识图谱的招标大数据分析研究
2024-10-319

本文首发于《招标采购管理》杂志2024年第2期








 

作者:陆洋  刘韬  丁矿

作者单位:中国石油物资有限公司


信息孤岛和招标数据智能化不足是招投标企业数字化转型必须攻破的难关。本文提出利用“唯一标识”和“数据编织”概念的基因编码方法和知识图谱,基于知识图谱的招标大数据分析模型,构建形成面向各类数据使用人员的动态唯一标识知识图谱,从而发挥数据价值,打破业务边界,实现招投标业务的数字化、智能化,为全生命周期采购提供技术支持和数据服务,为现代智慧供应链发展贡献力量。


一、引言

随着大数据技术飞速发展,大数据应用已经逐渐融入招标采购领域,智慧采购也随之拥有了数据基础。本文针对招投标业务及供应链管理等系统中存在数据交互效率低、数据质量不高、数据分析结果不准确等问题,站在全新历史节点上,利用“唯一标识”和“数据编织”概念的基因编码方法和数据模型,梳理招标数据,构建唯一标识知识图谱,实现“一物一码、一事一码、一码全景”的数据交互和信息要素的共享。


二、存在的问题及解决思路

(一)存在的问题

由于现有的招标采购平台信息系统通常侧重于支撑业务开展,自身的汇总统计功能还不完善,数据分析功能不精细,导致十几年甚至几十年以来所积累的大量历史数据只能分布式、碎片化存储。无论招标人还是投标人都缺少统一的数据获取渠道,招标机构缺少对历史数据的有效挖掘,在决策能力建设和增值服务发掘方面缺少突破性的创新。

1.  招标信息孤岛问题

目前管理部门、招标人、招标机构、投标人的招标投标信息各自独立,每个项目各招投标环节的具体信息只有项目负责人掌握,无法发挥集约化、规模化、整体化效应,亟需探索如何实现招投标数据的资源共享。

2.  招标数据智能化不足问题

随着数据智能时代的到来,数据不断积累与使用,各行各业进行了众多大数据及人工智能方面的探索,同时暴露出数据孤立性、分析模式化等问题,对数据的关联化、知识化、智能化做得相对不足。

(二)解决思路

知识图谱得益于其顶点和边的数据结构,具有优秀的表达能力,提高从“关系”的角度去分析问题、发现问题的能力,能够更好地描摹世界真实存在的形态,因此,知识图谱技术将成为数据分析领域的核心驱动力。基于虚拟化设计的数据标识以“去中心化”“非点对点”的形式自由连接,构建面向各类数据使用人员的动态唯一标识知识图谱,通过业务数据化,打破业务边界、优化业务流程、降低运营成本、提升系统效率,为招投标各方主体提供相关项目的历史招标信息,为后续采购方案提供技术支持和数据服务,实现全生命周期招标采购,为引领现代智慧供应链发展贡献力量。


三、构建模型


(一)设计思路

1. 数据来源

模型主要数据来源为供应商管理系统、电子招投标系统、合同管理系统及物资主数据等与招投标业务相关联和供应链涉及的其他管理系统,以及招标业务人员个人存档数据和相关网络公开报道事件等。

2.取数方式

优选的取数方式为与各管理系统通过API、JS、SDK等多种接入方式,定时传输数据,对于不满足开通接口的系统,可以选择手工输入的方式。

3. 必备条件

(1)提供数据的主体必须具有唯一的身份标识;

(2)具备完整的以招投标业务为中心的供应链节点目录;

(3)制定满足供应链目录的数据模板。

4. 底层技术

主要采用的技术是“唯一标识”基因码和“知识图谱”数据编织技术,结合已经成熟的多种数据同步方式和数据标签技术。

(二)模型介绍

基于知识图谱的招标大数据分析模型(见图1)立足于招标采购的业务管理与用户服务,主要包括供应链节点层、经营管理层与技术数据支撑层。供应链节点层包括供应主体、采购主体与用户主体三种系统角色,其中供应主体主要是指供应商、投标人、潜在投标人等在供应链中提供物资或者服务的机构或个人;采购主体是指招标采购的执行单位或个人;用户主体是指委托招标人、物资或服务实际使用单位。经营管理层主要指采购主体的日常业务管理,包括供应商管理、招投标管理、合同管理以及物资管理等业务;技术数据支撑层主要是为经营管理层提供技术支撑和数据支持。

模型主要有以下几个模块(见图2)组成:

(1)数据识别处理模块。首先对于其他系统传输的数据进行识别,初步判断数据来源于供应主体、采购主体或用户主体;然后对经过识别的数据进行清洗,以实现数据的格式标准化,对存在的错误数据以及重复数据进行剔除,将处理后的数据进行存储。

(2)数据标定模块。将存储的数据按照数据所属关系、数据格式、数据流转顺序和业务流程等层级进行标定,建立数据标签,并将已经标定的数据填入到预设的供应链目录数据模版,形成数据集。

(3)赋码模块。按照供应链目录数据模板,对基于供应链目录模版生成的数据集进行统一格式的编码,生成唯一的身份标识。

(4)图谱生成拓展模块。针对具有唯一身份标识的数据集,结合数据标签分类,按照既定的数据分析目标进行整合,构建招标知识图谱,同时结合AI学习模型,实现自动化数据分析,为招投标业务的决策分析提供支撑。

(三)实现功能

以采购主体为中心,以采购主体业务为主线,通过为供应链目录的各个节点赋予唯一标识,利用大数据、云计算和数据编织技术,将供应链上游的供应主体和供应链下游的用户主体数据汇集编织,为供应商、招采物资、从业人员等管理单元绘制知识图谱,深度挖掘基于业务流产生的数据价值,辅助招标方案的制定、采购策略的执行和业务管理等工作的自主开展实施,助力招标采购业务由BI分析向AI执行的跨越。

(四)图谱呈现

以光伏组件招标项目为例。采用“唯一标识”基因码和“知识图谱”数据编织技术,构建5个供应商基因码标识、1个用户单位基因码标识、1个招标机构基因码标识、1个光伏组件基因码标识、1个采购合同基因码标识、55个基因码实体、170个AB路径。通过模型输出以此招标项目为招标业务场景的知识图谱,得到招标人、招标机构、投标人、采购合同、项目人员、生产设备等各个节点的关系网络,每个节点都赋有专属的基因码,不仅能获取节点的基本信息,还能探索节点间的关系(见图3)。

业务人员根据需要可以任意获取某个节点信息,进一步探索与该节点关联的其余节点信息。比如在图3的图谱中选取此招标项目的中标人晶科能源股份有限公司,就能得到与该公司相关联的企业基本信息、资质证书、主要产品、生产设备、项目业绩等节点信息。

通过知识图谱招标大数据模型获得潜在投标人基本信息、制造商情况、业绩情况、投标报价、历史业绩汇总、中标结果、异议情况、交货情况、售后服务等内容,给招标文件设置合理业绩要求、最高限价等要求提供了有效的参考依据,不但可以减少采购时间和经济成本,还可以进一步对历史价格进行分析,了解更多供应商甚至分供应商的价格变动和趋势,约束投标人不合理性报价,以较低廉的价格采购到满意的产品(见图4)。

由此可见,基于知识图谱的招标大数据模型构建成型后,能够提供局部到整体,信息自动成链,全链数据洞察,自助数据服务,而且能够展示产品的产能、技术布局,发现卡脖子、高风险、强地位的招标关键节点,提前进行风险分析,优化采购策略。



四、模型效果与应用前景


(一)确保招标采购项目合规实施

基于知识图谱,可在招投标、采购交付、实施、运行、售后等环节对供应商进行差异化管控,了解供应商的各项薄弱环节,针对性进行风险预警。建立供应商业绩评价体系,基于全量的数据和大数据,完善供应商业绩资源库,加强产品质量、履约绩效全过程溯源管理,避免因招标人设置歧视性业绩门槛导致的不合规事项。

(二)解决数据共享和信息协同的问题

通过全流程招标业务的标准化设计和结构化拆解,建立了各节点数据模板,同时选择二维码、RFID等标签载体,实现了招标项目、投标项目、中标结果、供应商的“一事一标识”精细化管理。供需双方都可以扫描“唯一标识”,实现双向数据维护。比如,内部招标人员可以同时维护一个招标项目的信息,外部供应商可以实时动态维护自身资质、业绩、设备、产品等信息。最为关键的是,任何被维护的信息,都能够被标准化识别、结构化存储,以前离散的人员、物资、装备、事件将有一份保留在数字世界的动态档案,同时将以“去中心化”“非点对点”的形式自由连接。如此,便可以通过一种“半孪生”的方式,解决现阶段只有部分人员掌握关键数据但全量数据无从获取的困局,由此奠定围绕数据开展招标业务提增增效活动的数据基础。

(三)实现供应链全量数据感知和应用

在基于“唯一标识”概念形成招标业务动态档案的过程中,标准化的数据模板能够自动将任何一个“唯一标识”转换为若干个实体与实体的连接。比如一个招标项目,可以建立“项目—人员—机构—产品”之间的图谱关系,成千上万个招标业务“唯一标识”自动构建出完整的招标业务大数据网络,实现所有人员、机构、项目、文档、产品的有机关联。一方面,任何业务人员都可以基于数据网络自主地开展数据探索,比如获取具体产品的历史投标数据、中标供应商数据,提升招标文件编制质量,降低项目流标等业务风险;另一方面,基于知识图谱的“自动补全”功能,招标管理部门可以有效地开展供应链数据洞察,通过分析供应链产品产能、技术布局,发现卡脖子、高风险、强地位的供应链节点,提前进行风险分析,优化采购招标策略,真正实现数据对业务的决策引领。

(四)应用前景和可推广性分析

为有效解决招标采购业务与供应链前后端缺少交互协同、不能建立供应商及具体招标项目数字画像等现实难题,从业务实际和潜在需求出发,建设形成招标大数据分析模型。其核心思想是让招标各环节的人员、物资、装备、事件不再仅是可见的实体,而是包含实体在内,扩展到时间、地点、特征、行为、关系等在内的多维度数据集合,并且随着实体承载的数据越来越多,将传统数据源之间的线性匹配转变成基于多维度信息的网络协同。

此外,招标大数据分析模型采用了“唯一标识”和“知识图谱”两项底层技术。“唯一标识”方面,已经出现了Handle标识、Ecode标识、VAA标识、基因码标识等多种标识类型,理论体系和技术架构均比较完备;“知识图谱”方面,在电商客户全息画像构建、大型知识问答平台建设等方面也已成熟应用,进一步的开发完善不存在任何的技术困难。

因此,结合上述设计思路与底层技术,招标大数据分析模型可以进一步由招标业务推广到整个物资全生命周期管理业务,通过供应链所有实体物资、虚拟事件的全覆盖,实现整个供应链各类数据要素的有效连接和图谱呈现。



★本会《招标采购管理》杂志拥有此文版权,若需转载或复制,请注明来源于《招标采购管理》,标注作者,并保持文章的完整性。否则,将追究法律责任。




点我访问原文链接