湖北省资产评估协会 \
返回主页 Sun
您当前的位置: 首页>>综合信息>>协会动态

《中国会计报》刊登武汉浩华资产评估咨询有限公司李林曦、金超署名文章

作者: 浏览量:

近日,武汉浩华资产评估咨询有限公司李林曦、金超在《中国会计报》刊登署名文章《自然语言处理在机器设备价值评估中的应用》。

湖北省资产评估协会

2025年4月8日

以下为原文内容:

自然语言处理在机器设备价值评估中的应用


在当今工业化与信息化快速融合的时代,机器设备价值评估对企业的投资决策以及融资增信等方面具有至关重要的意义。以往机器设备的评估需要人工操作,是资产评估领域最难自动化实施的业务。人工操作不仅效率低下,而且容易出现差错。自然语言处理(NLP)是跨越多个领域的计算研究,是人工智能领域的一个重要方向,在机器设备评估中可以提供全新视角。

NLP应用流程预想

在准备阶段,一是构建分词词典。在机器设备评估时,设备名称往往是评估人员对设备最为直观的认知。构建一个只包含设备核心名称的分词词典是后续所有工作的基础。通过对设备名称进行系统收集和整理,将机器设备的核心名称纳入词典,不仅有助于精准识别设备名称中的核心名称,还能在分词过程中过滤掉入账时人为加入的定语等与设备核心名称无关的信息。

二是构建用于机器学习的设备语料库。高质量带标注的语料库是NLP模型训练的关键,可以根据统计局工业生产者分类通过人工打标的工作形成带有设备类型标注的语料库。然后运用GloVe、Word2Vec或FastText等主流NLP算法为语料库构建词向量,将每个带有设备行业标注的单词映射到一个固定维度的向量空间中,使语义相近的单词在向量空间中的位置靠近。这种空间靠近的词向量能够有效地将不同的设备名称根据标注进行分类,为后续评估提供有力支持。

三是训练优化保存模型。在构建好带标注的语料库后,可以运用Scikit-learn、TensorFlow等AI训练库进行训练,通过多轮调参和训练,将模型损失减小,且逐步收敛将模型的参数和结构进行保存,可以实现单机不联网工作。

在实现阶段,一是读取机器设备名称并分词提取核心设备名。在机器设备评估实务中,财务人员录入的设备名称通常存在不规范、根据不同的情况加定语的现象,有时还会出现错别字的问题。例如,同一类型设备可能由于录入人员对设备理解的差异或疏忽,出现多种不同的记录方式。如“3车间启动电动机”“车间3号电动机”“电动机(3车间用)”等,这些记录方式都指向同一设备核心名称“电动机”。利用之前构建的分词词典对这些账面设备名称进行分词处理,能够有效地筛选出核心的设备名称。分词过程通过匹配词典中的词汇,将设备名称分解为多个词汇单元,然后根据设备核心名称,选取最能代表设备本质的核心单词。在上例中,“3车间启动电动机”根据之前构建的分词词典分词后可得到“3”“车间”“启动”“电动机”等单词,通过词性分析和词典匹配,确定“电动机”为设备核心名称。这样既能够在语料库标注阶段减少工作量,又可为后续评估和分类提供准确的单词。

二是根据词向量归类。将分词提取出的核心设备名称进一步转化为词向量表示后,利用预先训练好的词向量模型对设备进行分类。在词向量空间中,语义相近的设备名称对应的向量之间的距离较近。如“深井泵”“泥浆泵”设备都属于统计局中“通用设备制造业”——“泵、阀门、压缩机及类似机械制造业”,通过计算词向量之间的相似度(如余弦相似度),可以将这些设备归为同一类别。同理,“举升机”“输送机”等设备则属于“通用设备制造业”——“物料搬运设备制造业”。这种方法可以将用自然语言描述的设备名称转化为可计算的向量,方便后续机器学习和计算。

三是对接数据库查询相关参数。通过调用机器设备数据库接口,可以快速查询不同类别设备的使用寿命、历史成交价格、PPI指数、安装调试费率等评估所需的数据。在查询过程中,以设备分类结果为索引,结合设备的品牌、型号等数据,在数据库中进行精准检索。例如,对于分类为“数控机床”的设备,进一步根据其品牌“XX机床厂”和型号“CK6150”在数据库中查找该设备的平均使用年限为10年,当前市场参考价格范围为5万元至8万元,PPI指数等信息。通过自动化对接数据库查询相关参数,可以大大提高机器设备评估的工作效率,还能够确保参数获取的准确性和及时性。

面临的挑战与解决方案

针对设备名称错分词问题,尽管构建分词词典,但在实际应用中仍会出现部分设备名称错分词的情况。例如,对于一些新型设备或具有特殊功能组合的设备,其名称可能不在分词词典中,导致分词出现偏差。为解决这一问题,可以动态更新分词词典,定期收集新的设备名称将其添加到词典中。

针对设备分类模糊问题,部分设备由于功能多样,在词向量分类和相似度计算时可能会出现多种归类情况,即一个设备可能同时属于多个类别。例如,“搅拌反应釜”既可以归为“搅拌设备”,也可以归类为“容器”。针对这类问题,可以采用多标签分类的方法,允许一个设备具有多个类别标签。同时,结合设备的实际应用场景或在整体生产线所处的地位等多维度信息,构建更加综合的设备分类模型。

在构建设备语料库和设备数据库时,数据质量较低是一个常见问题。为解决这一问题,在数据收集阶段,需要建立严格的数据审核机制,对每一条数据进行校验和清洗,并提示相关人员进行修正。

随着AI技术的发展,人工智能是发展趋势。虽然目前大模型在资产评估中应用相对落后,但通过NLP在机器设备评估中的应用,构建评估行业垂直领域可以落地应用的小模型,可以推动整个行业的技术进步和创新发展,为人工智能时代资产评估发展提供新的思路和方法。