天天看点

科学计量学法回顾现有的数据驱动工程设计

作者:葛剑生

大数据的探索和挖掘为工程设计提供了大量的机会,所以在过去的二十年中,有关工程设计和产品开发的数据迅速增加。然而,由于大量的数据源和格式加上设计过程的高度复杂性,这些技术尚未充分发挥其最大潜力。

通过科学计量学方法进行了系统的文章获取程序,从Web of Science (WoS)和Scopus中提取了3339篇与工程设计和大数据分析应用相关的文章,而后通过简明的数据筛选,将该数据集缩减为366篇文章的数据集。

通过这些文章,分析近20年来数据驱动工程设计(DDED)研究的动态,并检测与DDED相关的主要研究主题、最有影响力的作者以及在DDED领域影响最大的论文。

此外,使用科学计量学法构建并分析了关键词/关键短语共现网络和合著者网络,揭示相关研究课题的互联性和最高产作者之间的合作关系,对过去20年来最先进的DDED进行了全面的评估。

DDED研究的年度演变

调查过去20年来与DDED相关的文章,提取了366种相关出版物的出版年份和出版类型,下图显示了过去二十年来每年的出版物数量。文献检索于2021年6月28日进行,包括截至该日期出版的所有相关期刊文章、会议论文和书籍章节。

科学计量学法回顾现有的数据驱动工程设计

由于文章标引的时间延迟,2020年和2021年的发表文章数量低于前两年。此外,2020年,会议投稿数量有所下降,这可能是由于对COVID-19大流行期间在线召开的科学会议的兴趣下降。

由图可知,2015年之后,与ddd相关的出版物出现了强劲的增长。

在金融、商业、创新管理、制造业、市场营销和用户体验等其他领域,也可以观察到数据科学和大数据研究的类似增长趋势。

关于产品、用户及其环境的数据获取工具和方法的发展,大数据分析的新算法、方法和工具的发展,以及计算能力的增强和存储能力的改进,使得数据科学在各个领域的整合变得更加容易,从而支持了数据驱动技术的快速发展。

此外,在工程设计中,改进的产品数据管理工具和平台也影响了这些技术的更快采用。有了新的工具,流程和设计师的行动可以很容易地跟踪,以及在产品开发和制造操作期间做出的决定。

同时,实时数据采集技术和更大的存储容量可以促进产品在使用过程中的监控和记录用户与产品的交互。各种网络收集技术扩大了分配和检索各种产品和用户数据的可能性。因此,许多进一步研究的机会是可能的。

有研究表明,数据驱动工程设计的研究文章数量逐年增加似乎与人工智能发展的增长趋势相一致。预计在今后几年中,这一领域的贡献将进一步扩大。

DDED中的主题

数据驱动工程设计是一个广泛的研究领域,涵盖了各种主题从收集的文章中提取的关键词调查DDED中出现的主要主题,结果显示了BDA在工程设计中的常见术语和应用领域,揭示了工程设计中最大、研究最多的领域和课题。

所进行的分析呈现了DDED中现有研究的知识图谱,然而,新兴趋势的识别需要额外的分析。下图为数据驱动工程设计文章作者关键词共享网络。

该网络将最常用的术语及其关系可视化,表明哪些关键词经常一起出现,以及DDED中研究主题的结构。

科学计量学法回顾现有的数据驱动工程设计

顶点对应于关键字,它们之间的链接(连接)表示两个关键字同时出现的文章,顶点的大小表示顶点的程度,即与特定关键字的连接数。为了使表示更清晰,上图中的网络只包含度≥20的顶点,实际的网络比浓缩的可视化包含更多的关键字和关系。

由上图可知,关键词“机器学习”、“数据挖掘”和“大数据”出现次数最多。并且“大数据”和“机器学习”一般都与“产品设计”和“产品开发”联系在一起。

“数据驱动设计”通常与“数据挖掘”、“大数据”和“产品服务系统”结合在一起,而“机器学习”与“人工智能”有着密切的联系。

一个紧密相连的集群包括关键词“客户评论”、“感性工程”、“情感分析”、“情感设计”和“意见挖掘”。这些关键词包括研究最多的数据源和在早期设计阶段使用的几种分析方法和方法,其中调查了用户偏好。

围绕该聚类的BDA技术是“文本挖掘”、“关联规则”、“决策树”和“自然语言处理”,它们适用于文本分析。在左侧,关键词“创意”与“设计过程”有关,而“聚类”和“文本挖掘”这两种技术则与“概念设计”阶段进一步接近。

在图的右上方,有一组人将“机器学习”与“计算机辅助设计”、“CAD”、“设计优化”、“仿真”和“数据驱动工程”等关键词联系起来。这些术语可能与实施例设计阶段有关,在该阶段使用CAD和CAE工具进行虚拟原型设计。

将BDA技术在设计中的应用称为数据驱动工程。图的下半部分指出了另一个主题,将“大数据”与“制造”、“智能制造”、“数字孪生”、“产品生命周期”和“网络物理系统”联系起来。

这意味着对数据驱动工程设计的研究,其重点是利用来自制造和产品开发后续阶段的数据来改进产品和服务设计。最常列在一起的关键词用粗线连接,这提供了有关DDED中相关概念的信息。

根据上图中出现频率最高的关键词,即可以识别出DDED中的主要主题。

回顾DDED作者、生产力和影响力

使用科学计量学法确定DDED中最具影响力的作品,通过分析每篇文章的名称、所属单位、引用次数和标题,来发现发现了活跃在DDED中的研究人员、最高产的作者和最具影响力的论文的地理分布,从而揭示了数据驱动方法在设计中的应用领域。

下图显示了研究数据驱动工程设计的出版物的地理分布,它描述了拥有两种或两种以上出版物的国家。出版物根据第一作者所属的国家被分配到一个特定的国家,放置在每个国家的圆圈的大小与每个国家生产的物品数量相对应。

由图可知美国发表论文80篇,中国发表论文76篇。紧随其后的是德国(40人)、英国(31人)和新加坡(21人)。很明显,美国和中国在数据驱动工程设计的研究和应用方面占据主导地位。

科学计量学法回顾现有的数据驱动工程设计

根据科学计量学法所得到的数据集,如果两位作者一起发表了至少两篇论文,则用一条线将他们连在一起。

顶点的大小对应于一个作者与其他作者的连接数,而链接的宽度与两个作者共同拥有的文章数成正比。在该网络中,显示了最小权重为7的连接,结果在11个集群中连接了116位作者,网络图如下。

科学计量学法回顾现有的数据驱动工程设计

数据驱动工程在数字孪生中显示着重要影响。近年来,数字孪生的概念对制造业产生了重大影响。它指的是创建一个由实时数据提供的产品或系统的虚拟双胞胎,目的是获得系统行为的更真实的图像。

在工业4.0的背景下,传感器与物联网和基于云的系统的应用使各种制造数据的收集、存储和利用变得更加容易,从而可以改进机器和制造过程的监测、优化和控制。关于在产品设计中使用数字孪生的研究越来越多;然而,它仍处于早期阶段。

数据驱动工程还在产品的情感设计中显示着重要影响。关于用户偏好和相关产品特性的新数据源正在被广泛探索,使用不同的文本挖掘和机器学习技术进行检索,例如在线评论。感性工学是一种将用户偏好映射到产品设计特性的常用方法。

数据驱动的方法也可以用于产品功能的分析,支持开发设计概念。

大数据分析(BDA)在产品设计中的最早应用之一是产品族和产品组合设计,使用各种BDA技术,可以根据相似性对产品变体进行比较,并根据它们对技术、经济和用户需求的响应方式进行评估。

BDA是一个科学技术的总称,它能够组织大数据,分析和发现大数据中的知识、模式和智能,并将发现的知识可视化并报告,以协助决策。

根据科学计量学法对被引用最多的文章的分析中可以确定,数据驱动工程还对探索从现有设计数据中获取设计知识的本体和语义网络以及应用数据挖掘技术预测设计变更传播显示着重要影响。

BDA在产品开发中的应用

根据科学计量学法筛选了366篇文章,并使用文本过滤功能根据文章标题中的关键词对文章进行分类。共有249件物品被分类,而考虑到关键词,其中51个适用于两个或多个类别。

在下图中,这些文章被包含在所有类别中,并被自动排序。由于产品开发阶段和活动之间没有明显的界限,有时也有重叠,因此这些物品被分配到更多的类别。

科学计量学法回顾现有的数据驱动工程设计

从数据库获得的366篇相关文章中,总共有117篇未按产品开发活动分类。这包括更广泛的评论文章、专注于教育的研究、总体设计原理和启发式的提取、可持续性设计、设计协作研究、过程挖掘和其他主题。

分类为不同产品开发活动的文章根据所使用的BDA技术进一步分类。对文章标题和摘要进行与BDA技术相关的关键词自动搜索。下图展示了BDA技术到产品开发活动的映射,在文章中找到了应用示例。

由于所有文章都没有采用标题或摘要中所述的BDA技术,因此映射所包含的文章少于按产品开发活动分类的文章。

科学计量学法回顾现有的数据驱动工程设计

在搜索的文章里,BDA技术在不同活动中的主要应用为:

构建以用户为中心的设计推荐系统;用于意见挖掘和情感设计,使用感性工程方法和情感分析进行处理;挖掘社交媒体和在线评论的文本;使用有关产品和组件功能的下游信息来促进类似产品的构思和概念生成。

识别功能和关键产品特征;开发新产品功能推荐系统;产品概念开发以及帮助概念选择和评估;探索动形状设计空间,以及将BDA集成到拓扑优化和生成设计系统;指导设计优化,提高最优搜索效率;提取模拟结果的大型数据集中有影响的模拟参数。

生产成本评估,视觉检查和质量控制,产品可制造性评估,故障预测以及在计算机视觉中使用深度学习;还可用于车削表面粗糙度预测的分类和回归技术,焊接中的应用,钣金成形和增材制造。

智能产品服务系统,优化设计并为用户提供新服务;挖掘历史服务文档的文本,开发了考虑产品元素和服务概念的服务演化图,研发出一种帮助预测未来产品使用的方法;预测用户选择模型。

在过去的二十年中,超过60%的文章仅在最近五年内发表,这表明DDED研究将继续发展和扩大。由于最近数据收集和处理技术的进步,以及实现BDA的工具和方法的个性化,这些结果是可以预料到的。

目前DDED的研究小组相当分散和脱节,这强调了当前想要发展DDED需要改善小组之间的合作,以促进研究领域的发展和增长。

当今拥有最多出版物和联系的领先研究小组包括来自中国、新加坡、美国和德国的学者。他们的研究主题主要包括情感设计的客户数据挖掘、数据支持的概念设计、产品服务系统设计、数字孪生和设计知识提取(早期产品开发阶段和使用中的产品)。

开发新的数据采集和管理工具和算法将为开发新的数据源提供可能性。它们可以结合不同的人工智能手段,这将使收集到的数据有意义,从而有助于在开发过程的不同阶段做出决策。

除了快速分析和解释能力之外,这种智能系统将通过检测人为错误和提供适当的建议,以及发现设计项目之间新的和未探索的联系来帮助设计师。

现在DDED的发展面对着很多挑战,而在所有这些挑战领域中,仍然存在一个悬而未决的问题,即如何获取和利用来自不同来源的数据,例如用户响应、计算研究、模型、测试,这些数据通常以文本、数字或图形等不同形式提供。

参考文献:

Daria Vlah, Andrej Kastrin, Janez Povh, Nikola Vukašinović,

Data-driven engineering design: A systematic review using scientometric approach,Advanced Engineering Informatics,Volume 54,2022,101774,ISSN 1474-0346,https://doi.org/10.1016/j.aei.2022.101774.

继续阅读