《一、研究背景》

一、研究背景

“制造强国战略研究(一期)”是中国工程院会 同工业和信息化部、国家质量监督检验检疫总局联 合组织开展的重大咨询项目。从 2013 年至 2014 年,经过系统深入的调查研究,项目明确提出了我国跨 入制造业强国行列的“三步走”战略目标,提出实 现制造强国必须遵循的“创新驱动、质量为先、绿 色发展、结构优化”的发展方针,以及实施“制造 强国”战略的八项战略对策,并提出要牢牢坚持发展制造业不动摇的思路,推动了《中国制造 2025》 的制定发布。

《中国制造 2025》提出了通过“三步走”实现 制造强国的战略目标,还提出大力推动重点领域突 破发展,聚焦新材料、新一代信息技术产业、节能 与新能源汽车、生物医药及高性能医疗器械、高档 数控机床和机器人、航空航天装备、海洋工程装备 及高技术船舶、先进轨道交通装备、农机装备、电 力装备十大重点领域。为了避免低端重复建设,工 业和信息化部委托课题组制定发布了指导十大领域 发展的技术路线图。各地政府纷纷响应中央号召, 制定地方政府的制造业发展规划及重点发展领域。 经调查,除西藏自治区、台湾省、香港特别行政区、 澳门特别行政区外,共有 30 个省市自治区发布了 “中国制造 2025”地区行动计划。30 个地区行动计 划中,黑龙江省、辽宁省、内蒙古自治区、宁夏回 族自治区并未公布完整版的文件。

在制定过程中,部分地方政府并未考虑自身发 展的现状及发展优势,将《中国制造 2025》提出的 十大领域均视为发展重点,试图全面攻克难关。在 人力、物力有限的情况下,优势、劣势领域共同发 展的难度将会大大提高,不仅无法完成领域发展目 标,也将在全国范围内带来新的产能过剩风险。

本文希望通过使用文本挖掘的方法,对各省市 自治区“中国制造 2025”地区行动计划进行分析, 首先,分析各省市自治区发布的行动计划是否符合 《中国制造 2025》提出的重点发展领域;其次,分 析各省市自治区在重点发展领域中的重点子领域是 否具有足够的差异性,从而提出政策建议,避免带 来新的产能过剩。同时,提出一种新的基于文本挖 掘的政策文件分析方法,解决单纯依赖人工、难以 迅速完整地对大量政策文件开展分析的问题。

《二、研究方法》

二、研究方法

《(一)重点发展领域跨省关联分析》

(一)重点发展领域跨省关联分析

1. 各省市自治区重点发展领域一致性分析

各省市自治区“中国制造 2025”地区行动计划 重点发展领域反映其在《中国制造 2025》的基础上 所提出的符合本省市条件的重点发展方向。各省市 自治区间重点发展领域的一致性反映了各省市自治 区与国家行动指南的一致程度。为了分析各省市自治区发布的行动计划是否符合《中国制造 2025》提 出的重点发展领域,本文提出了一种基于文本挖掘 包括中文分词 [1,2]、词性分析 [3,4]、特征筛选 [5,6]、 相似度计算 [7,8] 的各省市自治区“中国制造 2025” 重点发展领域一致性分析方法,流程如图 1 所示。

《图 1》

图 1 各省市自治区重点发展领域一致性分析流程

 

首先通过 Java 编程语言对各省市自治区“中国 制造 2025”地区行动计划重点发展领域提取中文分 词并开展词性分析,再基于词性进行筛选,得到 初始特征集 [9]。由于各省市自治区在地区行动计 划中对相同重点发展领域表述时的措辞存在差异, 因此采用人工归并特征词的方法,把语义相同的 初始特征词归为一类,并将归类后的特征词作为 最终的特征集 [10]

将各省市自治区的所有重点发展领域与最终特 征集进行匹配,构造各省市自治区重点发展领域的 向量空间模型,向量空间模型的维度等于最终特征 集的数量,权重为各省市自治区重点发展领域包含 最终特征集中特证词的数量 [11,12]。

通过计算各省市自治区重点发展领域的向量空 间模型相似度来分析各省市自治区间重点发展领域 的一致性。本文采用欧氏距离来度量向量空间模型 的相似度 [13~16]。将欧氏距离看作信号的相似程 度,距离越近相似度越大,距离越远相似度越小。欧氏距离的计算如下:

式中,d12 表示欧式空间中两个点的距离;x1k 表 示第一个点的第 k 维坐标;x2k 表示第二个点的第 k 维坐标。

2. 各省市自治区重点发展领域子领域差异性分析

各省市自治区“中国制造 2025”地区行动计划 重点发展领域具有一致性的同时,应该根据自身特 点具有自己的发展特色,即各省市自治区间相同的 重点发展领域的子领域应具有差异性,从而避免新 一轮的产能过剩风险。本文提出了一种基于重点发 展领域跨省关联分析结果及中文分词、特征筛选、 相似度计算的基于文本挖掘的各省市自治区相同重 点发展领域的重点发展子领域差异性分析方法,流 程如图 2 所示。

《图 2》

图 2 各省市自治区重点发展子领域差异性分析流程

 

选定各省市自治区相似度高的重点发展领域, 通过 Java 编程语言对各省市自治区的重点发展子领 域进行提取,对于领域内容进行中文分词和词性分 析,并基于词性进行筛选,得到初始特征集,再通 过人工归并特征词,把语义相同的初始特征词归为 一类,并将归类后的特征词作为最终的特征集。各 个重点发展子领域通过与最终特征集进行匹配,构 造各个重点发展子领域的向量空间模型。通过计算 各省市自治区重点发展子领域的向量空间模型相似 度来分析各省市自治区间重点发展子领域的差异性, 同样采用欧氏距离来度量向量空间模型的相似度。

《(二)研究框架》

(二)研究框架

首先对各省市自治区“中国制造 2025”地区行 动计划重点发展领域通过特征提取来构建向量空间 模型,并采用欧氏距离来衡量各省市自治区向量空间模型的相似度,基于相似度完成各省市自治区重 点发展领域一致性分析 [17~19]。选取省份覆盖面 广的重点发展领域,并对包含该重点领域的省市进 行重点发展子领域分析,对各省市自治区重点发展 子领域通过特征提取来构建向量空间模型,并采用 欧氏距离来衡量各省市自治区向量空间模型的相似 度,基于相似度完成各省市自治区重点发展子领域 差异性分析 [17,20]。重点发展领域跨省关联分析研 究框架,如图 3 所示。

《图 3》

图 3 重点发展领域跨省关联分析研究框架

 

《三、地区行动计划分析结果》

三、地区行动计划分析结果

《(一)各省市自治区重点发展领域一致性分析》

(一)各省市自治区重点发展领域一致性分析

首先通过 Java 编程语言对各省市自治区的重点发展领域进行提取,对各省市自治区重点发展领 域进行中文分词和词性分析,并基于词性进行筛选, 经人工归并特征词,最终得到的特征集如表 1 所示。

《表 1》

表 1 最终特征集

 

采用欧氏距离来衡量各省市自治区重点领域向 量空间模型的相似度,以分析各省市自治区重点发 展领域一致性的相似度计算结果,如图 4 所示。

《图 4》

图 4 各省市自治区重点发展领域相似度

 

图 4 中,每个方格里的黑色实心圆代表两个省 市所提出的“中国制造 2025”地区行动计划的重点 发展领域的文本相似度。黑色实心圆越大表示相似 度越大,如同一个省市之间的相似度就是比较大的 黑色实心圆,因为它们所包含的的重点领域是完全 一致的。

从图 4 可以得出,北京、广东、贵州、海南、 河北、山西、云南所提出的“中国制造 2025”的重 点发展领域文本相似度较大,根据分词结果可以得 到这些省市所提出的“中国制造 2025”重点领域都 集中在物联网、云计算、新材料、医药、制造等新 兴领域,而这些领域恰好是《中国制造 2025》倡导 的核心发展领域,因此,上述各省市自治区地区行 动计划非常贴近《中国制造 2025》,这些省市对“中 国制造 2025”战略的实施发挥出积极的引领作用。

《(二)各省市自治区重点发展领域差异性分析》

(二)各省市自治区重点发展领域差异性分析

选取新材料、新一代信息技术产业、节能与新能源汽车、生物医药及高性能医疗器械、高档数控 机床和机器人、航空航天装备、海洋工程装备及高 技术船舶、先进轨道交通装备、农机装备、电力装 备十大重点领域作为示例研究领域,并对十大领域 的重点子领域进行分析。对各省市自治区重点子领 域通过特征提取构建向量空间模型,并采用欧氏距 离来衡量各省市自治区向量空间模型的相似度,基 于相似度完成重点发展子领域跨省差异性分析。各 省市自治区重点发展子领域的相似度如图 5~ 图 14 所示。图中每个方格里的黑色实心圆代表两个省 市所提出的重点发展领域的重点发展子领域文本 相似度。

《图 5》

图 5 各省市自治区新材料重点发展子领域相似度

 

《图 6》

图 6 各省市自治区新一代信息技术产业重点发展子领域相似度

 

《图 7》

图 7 各省市自治区节能与新能源汽车重点发展子领域相似度

 

《图 8》

图 8 各省市自治区生物医药及高性能医疗器械重点发展子领域相似度

 

《图 9》

图 9 各省市自治区高档数控机床和机器人重点发展子领域 相似度

 

《图 10》

图 10 各省市自治区航空航天装备重点发展子领域相似度

 

《图 11》

图 11 各省市自治区海洋工程装备及高技术船舶 重点发展子领域相似度

 

《图 12》

图 12 各省市自治区先进轨道交通装备重点发展子领域相似度

 

《图 13》

图 13 各省市自治区农机装备重点发展子领域相似度

 

《图 14》

图 14 各省市自治区电力装备重点发展子领域相似度

 

从图 5 可以得出,总体来说各省市自治区在新 材料领域的重点发展子领域相似度不高,说明各省 市自治区在新材料领域的重点发展子领域的发展侧 重点大有不同,各省市自治区在新材料领域的发展 根据情况各有分工,一定程度上避免了新材料领域 可能发生的新一轮产能过剩的问题,可以使资源配 置更加合理。从图 5 可以看出,河北和甘肃、甘肃 与重庆、广东和重庆两两之间的相似度较大。在 新材料领域,河北、甘肃、重庆、广东均将重点放在了冶金、化工新材料领域。

从图 6 可以得出,总体来说各省市自治区在新 一代信息技术产业领域的重点发展子领域具有一定 相似度,只有海南、湖南、新疆与其他省市相似度 较小,在新一代信息技术产业的发展中,有一定的 产生新一轮产能过剩的潜在风险。具体来讲,安徽 和湖北、福建和湖北、福建和山西、湖北和山西两 两之间的相似度较大。在新一代信息技术产业领域, 安徽、湖北、福建、山西四省均将重点放在了集成 电路、智能终端领域。

从图 7 可以得出,总体来说各省市自治区在 节能与新能源汽车领域的重点发展子领域相似度不 高,但天津、上海、吉林相似度明显高过其他省市, 其重点均是智能网联汽车领域。其他省市相似度不 高,产生新一轮产能过剩的风险不高,但要关注局 部地区的重复性投资问题。

从图 8 可以得出,总体来说各省市自治区在生 物医药及高性能医疗器械领域的重点发展子领域相 似度较高,只有山东和浙江与其他省市相似度较低, 这一情况表明在生物医药及高性能医疗器械领域, 容易造成资源过度集中,重复投资,不能根据各省市自治区特点合理配制资源,产生新一轮产能过剩 的风险也较高。尤其吉林、甘肃、河北、上海四省 市相似度最高,均将重点放在了高性能医疗器械、 生物制药领域。

从图 9 可以得出,总体来说各省市自治区在 高档数控机床和机器人领域的重点发展子领域各 有不同,四川和河南、四川和甘肃、河南和湖南 两两之间的相似度较大。在高档数控机床和机器 人领域,四川、河南、甘肃、湖南四省均将重点 放在了数控机床、机器人领域,产生新一轮产能 过剩的潜在风险较高;而浙江、吉林与其他省市 间的相似度较低,结合两省情况与特色,在高档 数控机床和机器人领域产生新一轮产能过剩的风 险较低。

从图 10 可以得出,总体来说各省市自治区在 航空航天装备领域的重点发展子领域相似度较低, 说明各省市自治区在航空航天装备领域的发展各 有侧重,从而在一定程度上避免了航空航天装备 领域出现新一轮产能过剩的风险,可以使资源配 置更加合理。只有安徽和四川、上海和吉林、四 川和上海两两之间的相似度相对较高。在航空航 天装备领域,安徽、四川、上海、吉林四省市均将重点放在了航空、航天、无人机领域。

从图 11 可以得出,总体来说各省市自治区在 海洋工程装备及高技术船舶领域的重点发展子领域 相似度较低,说明各省市自治区在海洋工程装备及 高技术船舶领域的发展各有侧重,在该领域造成 新一轮产能过剩的风险较低。其中,安徽和湖北、安徽和上海、安徽和天津两两之间的相似度相对 较高,均将重点放在了高技术船舶、海洋工程装 备领域。

从图 12 可以得出,总体来说各省市自治区在 先进轨道交通装备领域的重点发展子领域相似度较 低,说明各省市自治区在先进轨道交通装备的重点 子领域各有侧重,在具体技术方向上重合度不高, 从而降低了先进轨道交通装备领域出现新一轮产能 过剩的风险,可以使资源配置更加合理。其中,相 似度相对较高的为天津和湖北,均将重点放在了轨 道交通车辆制造、关键部件制造领域。

从图 13 可以得出,总体来说各省市自治区在农机装备领域的重点发展子领域相似度较高,技术 发展方向重合度较高,造成新一轮产能过剩的风险 较高。其中,相似度最高的为四川和甘肃、四川和 吉林、吉林和甘肃。四川、甘肃、吉林三省均将重 点放在了丘陵地区的农业作业机械、农产品加工机 械和现代精细农业装备领域。

从图 14 可以得出,总体来说各省市自治区在电 力装备领域的重点发展子领域相似度有高有低,其中, 新疆和天津、新疆和广西、新疆和甘肃两两之间的相 似度均较高,均将重点放在了智能电网输变电领域, 这一方向有造成新一轮产能过剩的风险。湖南省与其 他省市的相似度都较低,具有一定的地方特色。

《四、结语》

四、结语

地方政府有可能在产能过剩的产生过程中扮演 一个较为积极的角色。2009 年,国家出台十大产业 振兴计划,地方政府不顾当地实际,积极出台优惠 政策加大鼓励、支持力度,造成了严重的全国性产 业重复投资现象,最终出现产能过剩。

根据上述分析发现,各省市自治区的关注点迅 速转移到十大重点领域,而传统产业的发展存在被 忽略的风险。另外,各省市自治区提出的重点领域 的发展方向大同小异,无法体现区域优势。地方政 策对重点产业发展有强烈的引导作用,为了避免再 次发生全国范围内的产能过剩,需要引导地区重点 产业发展有所差异,因此建议如下:

(1)修订《中国制造 2025 分省市指南》,推进 区域协调发展。依托区域特色优势,针对不同行业、 不同规模的企业需求,通过差异化的政策支持,激 发区域发展活力,促进区域发展。对各地区重点发 展领域进行竞争力对标分析,明确各地区在全国处 于第一、第二、第三产业的细分领域,作为支持发 展的重点。

(2)定期滚动发布热点领域产能与需求变化信 息。引导各级政府加强产业信息化建设,利用新一 代信息技术与网络技术,实时追踪重点、热点产业 的市场供需情况变化,并予以发布。