-
通过遗传编程和大型语言模型辅助的课程学习进行策略搜索
摘要课程学习(Curriculum Learning, CL)是指利用用户提供的多样化测试用例来学习策略,这些测试用例具有不同的难度级别,并按照适当的顺序组织起来。测试用例的质量对于遗传编程(Genetic Programming, GP)等优化技术解决策略搜索问题至关重要。在这项研究中,我们评估了大型语言模型(Large Language Models, LLMs)作为基于GP的策略搜索测试用例提供者的能力。我们考虑了两种策略搜索任务:单人游戏和多人游戏,并使用了四种在复杂性和专业化方面各不相同的LLMs,通过对其进行引导来生成适用于这两种游戏的测试用例。我们通过实验评估了LLM生成的测试用
来源:ACM Transactions on Evolutionary Learning and Optimization
时间:2025-11-08
-
ITEMTK:物联网流量暴露监控工具包
摘要物联网(IoT)设备产生的网络流量数据由互联网服务提供商(ISPs)和物联网制造商收集,这些数据通常也会与第三方共享,以维护和提升用户体验。不幸的是,网络途中的攻击者可以通过分析这些网络流量痕迹来获取用户的敏感和私人信息。尽管关于防御这种侧信道攻击(即恶意物联网流量分析,TA)的文献越来越多,但目前还没有系统的方法来比较和评估这些现有研究的全面性。为了解决这个问题,我们设计了一个新的低成本、开源的系统框架——IoT流量暴露监控工具包(ITEMTK),该工具包使人们能够全面检查和验证现有的攻击模型及其防御方法。在ITEMTK的设计过程中,我们还发现了一种新型的基于图像的攻击方式,即使用户在智
来源:ACM Transactions on Internet of Things
时间:2025-11-08
-
ChatDC:通过大型语言模型生成具备几何感知能力的数据中心数字孪生
摘要现代数据中心依赖于“资产互联网”(IoA),这是一种专门的物联网(IoT)形式。在这些资产中,具备仿真功能的设备不仅包含物理属性,还连接了数据流,用于被动数据收集和主动仿真。数字孪生(DT)是IoA系统的虚拟副本,具有适当的抽象层次,能够整合资产级别的动态模型来模拟整个系统的行为、进行原型设计以及开展假设分析。然而,创建高保真度的数字孪生受到手动编码复杂几何布局和特定领域设计约束的限制。尽管大型语言模型(LLMs)具有自动化潜力,但现有方法由于领域集成能力有限,难以生成在几何上合理且在功能上有效的数字孪生场景。为了解决这一问题,我们提出了ChatDC——一个基于对话的系统,它利用LLMs通
来源:ACM Transactions on Internet of Things
时间:2025-11-08
-
LUMEN:利用多智能体大型语言模型和知识图谱提升物联网系统的可观测性
摘要物联网(IoT)系统的迅速发展通过实时监控和自动化改变了各个行业,产生了大量且多样化的数据流。随着物联网网络的不断扩大,数据量和多样性的增加(包括实时遥测数据、设备日志和历史记录),物联网系统的管理变得更加复杂,涉及系统监控、分析和推理等方面。为应对这一挑战,我们提出了LUMEN(Large Language Models as Unified Multi-Agent Systems for IoT Enhancement)这一创新方法,该方法结合了多智能体大型语言模型(LLMs)、知识图谱和异构数据库,以实现物联网的可观测性。LUMEN将物联网系统视为知识图谱,捕捉设备之间的关系和元数据
来源:ACM Transactions on Internet of Things
时间:2025-11-08
-
从指标到意义:是时候重新思考人机协同设计中的评估方式了
摘要随着人工智能系统在创意设计领域中越来越多地影响决策过程,理解人类如何与这些工具互动已成为交互式智能系统研究中的一个关键挑战。本文提出了一种重新思考评估人机协作系统的方法,倡导采用更加细致和多维度的评估方式。研究基于迄今为止规模最大的相关领域研究之一(参与者数量为808人)——该研究探讨了人机协同创作系统“The Genetic Car Designer”的表现,并结合了一项受控实验室研究(参与者数量为12人)的结果。该系统采用了一种交互式进化算法,参与者需要设计汽车的二维图像。参与者会看到由智能系统MAP–Elites生成的设计建议图库,以及一个随机对照组提供的设计内容。研究结果表明,接触
来源:ACM Transactions on Interactive Intelligent Systems
时间:2025-11-08
-
“我被理解了吗?”:身体表现与心智理论之间的相互作用如何影响基于大型语言模型(LLM)的对话式代理在感知信任、拟人化、存在感、可用性和用户体验方面的表现
摘要近年来,基于大语言模型(LLM)的对话式代理因其具备自然、类似人类的对话交互能力而变得越来越受欢迎。然而,由于对隐私的担忧、可能出现错误回答(通常称为“幻觉”)以及与社会偏见相关的问题,人们对LLM仍存有疑虑。先前的AI研究表明,拟人化形式能够积极影响用户的感知。然而,在基于LLM的对话式代理研究中,这一方面尚未得到充分探索。我们的研究采用了两种拟人化形式:具身化和行为化。具身化拟人化形式包括聊天机器人、带有文本转语音(TTS)功能的聊天机器人以及具身化对话式代理(ECA)界面设计。行为化拟人化形式则涉及使用或不使用心智理论(ToM)原则进行训练的LLM。在实证评估中,我们探讨了行为化形式
来源:ACM Transactions on Interactive Intelligent Systems
时间:2025-11-08
-
工业机器人中的性别编码:全是工作,没有娱乐,也没有显著差异
摘要在机器人中赋予性别特征是一种常见做法,尤其是在社交场景中,因为这类机器人的拟人化设计通常更为明显。然而,即便是工业机器人,尽管其拟人化程度较低,有时也会被赋予性别暗示,比如使用男性或女性的名称或刻板的颜色。尽管关于在工业环境中使用性别编码的影响的研究有限,但这种做法仍然存在。我们的研究探讨了在工业机器人中编码性别特征对刻板印象、信任感和行为依赖性的影响。在实验室实验中,参与者与一个被编码为女性、男性或无性别的协作机器人一起执行焊接质量检测任务。该机器人会提供可能存在缺陷的焊接部位的扫描图像,并分析缺陷区域的比例。随后,参与者对这些缺陷区域进行评估。我们测量了与性别相关的刻板印象(如温暖感、
来源:ACM Transactions on Human-Robot Interaction
时间:2025-11-08
-
选择“完美”的量表:评估人机交互(HRI)领域现有量表的入门指南
摘要在人机交互(HRI)研究中,量表被广泛使用。然而,由于该领域的跨学科性质,许多研究人员缺乏心理测量学的直接培训。这给量表的恰当选择、可靠性和有效性的准确评估以及量表的实际应用带来了挑战。我们提供了一份教程,旨在帮助没有量表开发经验的研究人员高效地评估量表的质量。该教程详细列出了相关问题和建议,以帮助读者对现有的HRI量表进行可靠的评估。随后,我们使用这份指南对“Godspeed”量表和“Robotic Social Attributes Scale”(RoSAS)进行了评估。结果表明,RoSAS已经通过了充分的验证;而Godspeed量表在应用于HRI场景之前还需要进一步的研究。文章最后就
来源:ACM Transactions on Human-Robot Interaction
时间:2025-11-08
-
何时寻求帮助:在人类监督的自主系统中运用基于信任的辅助决策机制
摘要我们的目标是通过对信任演变的建模和实验评估,来预测人机团队在动态环境中的未来信念和行为。研究表明,在人机团队中保持适当的信任水平对团队成功至关重要。实际上,信任是一个多维度且潜在的实体,它以复杂的方式与过去的经历和未来的行动相关联。通过使用人机协作任务,我们利用输入输出隐马尔可夫模型(IOHMM)对人类行为进行建模,并利用部分可观测马尔可夫决策过程(POMDP)框架为机器人设计最优的辅助请求策略。在这个任务中,人类伙伴监督一个自主移动操纵器在环境中收集物体。监督者的职责是确保机器人安全地完成任务。机器人可以选择尝试自主收集物体,或者寻求人类的帮助。人类监督者会积极监控机器人的活动,在需要时
来源:ACM Transactions on Human-Robot Interaction
时间:2025-11-08
-
评估用于自动评分的人工智能模型:用简单的语言解释问题——面临的挑战与需要考虑的因素
摘要代码阅读能力在评估中一直未得到足够的重视,因为难以大规模地进行评估。先前的研究表明,代码阅读和代码编写是密切相关的技能;因此,能够评估和训练代码阅读能力可能对学生的学习至关重要。评估代码阅读能力的一种方法是使用“用简单语言解释代码”(Explain in Plain English, EiPE)问题,这类问题要求学生用自然语言描述一段代码的功能。以往的研究使用基于二元分类(正确/错误)的自动评分系统,并结合二元模型对学生答案进行评分,其效果与人工助教相当。我们利用来自17个EiPE问题的3,064份学生答案,对多种自动评分系统进行了评估。评估的方法从基于二元特征的逻辑回归,到使用大型语言模
来源:ACM Transactions on Interactive Intelligent Systems
时间:2025-11-08
-
研究生理反应和面部表情作为机器人伙伴信任度指标的作用
摘要机器人辅助能力的发展使它们在制造、医疗和教育等多个领域得到了更广泛的应用。为了实现机器人与人类之间更高效、更流畅的合作,有必要研究人类在合作过程中对机器人伙伴的信任程度。目前对人类信任机器人伙伴的测量通常依赖于反思性的主观调查方法,这些方法难以被整合到机器人的决策模型中以实现实时应用。为了解决这一挑战,我们旨在寻找可以纳入机器人决策过程的客观信任度测量方法。我们在一项面对面的机器人与人合作研究中,分析了生理数据(皮肤电活动(EDA)、皮肤温度(TEMP)和血容量脉动(BVP)以及面部表情,并报告了信任对这些客观测量指标的影响。研究结果表明,不信任机器人的参与者表现出更高的皮肤电活动、更高的
来源:ACM Transactions on Human-Robot Interaction
时间:2025-11-08
-
利用深度学习管理医疗信息泛滥问题,以提升医疗服务质量
摘要数字医疗数据的采集与处理依赖于人工智能和物联网技术,而数据和信息的数字化会影响到患者的行为。关于全球性大流行病COVID-19的新闻在社交媒体上广泛传播,形成了庞大的数据量。人们对这场大流行的认知通过信息、社交媒体帖子、推文和视频等形式迅速扩散。因此,评估疫情期间社交媒体上的信息流动情况对于防止恐慌情绪的蔓延具有重要意义。本研究旨在利用IEEE Data Port提供的数据集,通过深度学习对有关COVID-19的社交媒体大数据进行情感分析,以帮助医疗专业人员制定能够影响公众舆论的社交媒体策略。所使用的数据集包含2020年5月30日收集的11,858条与COVID-19相关的推文。首先,使用
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
利用深度学习算法进行低资源语言分析以实现性别分类
摘要语音信号是基于人机交互技术的应用中最重要的输入来源。通过语音信号进行性别识别是一项极具挑战性的任务。对于基于语音信号的分析,深度学习算法为传统的分类算法提供了一种替代方案。为了识别女性、男性和“初次”跨性别者的性别,本文采用深度学习算法,并利用梅尔频率倒谱系数(MFCC)作为语音信号的特征,以提高识别模型的鲁棒性。本文通过录制的实时语音信号展示了性别识别的准确性。第三性别的语音样本是用印地语录制的,这类印地语语音样本资源非常稀缺,且在任何公认的资料库中都难以找到。模拟结果不依赖于信号的长度,也与文本内容无关。在录制的语音信号上应用了循环神经网络——双向长短期记忆(RNN-BiLSTM)算法
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
基于深度卷积神经网络(Deep CNNs)的学生课堂行为特征检测与分析研究
摘要人工智能技术的持续发展也促使传统的教育模式开始发生变化。将智能监控设备应用于现代课堂的新教育模式得到了各大高校的青睐,这种模式能够帮助教师更好地教导学生。基于此,本研究试图改进深度学习领域中的目标检测算法,并提出了一种基于深度卷积神经网络来检测和分析学生课堂行为的方法。该方法旨在优化学生课堂行为的检测与分析流程,利用智能监控设备辅助教师进行学生管理,从而提升教学质量。研究首先分析了目标检测算法的核心步骤,随后通过添加特征融合层和重成像模块对YOLOv5s算法进行了改进,最终构建了Ghost-4D-YOLOv5s网络模型。实验结果表明,Ghost-4D-YOLOv5s模型在精确度、召回率、F
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
针对资源匮乏语言的机器翻译的自动资源扩充:EnIndic语料库
摘要平行语料库是机器翻译的核心要素,用于训练统计机器翻译(SMT)和神经机器翻译(NMT)系统。目前,高质量的印地语-英语平行语料库较为匮乏。虽然对于特定语言对而言,相对容易找到可比较的语料库,但这些语料库无法直接应用于SMT或NMT系统中。因此,我们通过处理这些可比较的语料库来生成新的平行语料库。具体方法是从这些语料库中提取相互对应的句子(即翻译结果),并利用句子长度及词翻译模型来匹配这些句子对。随后,通过基于IBM模型1翻译概率的相似度评分,筛选出翻译质量较差的句子对。我们将该算法应用于从印度总统和副总统演讲中爬取的可比较语料库,并从中提取出平行语料库。最终得到的平行语料库中,句子对的对齐
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
基于新媒体的应用语言学与外语语言能力多样化研究
摘要为了提高应用语言学和外语学中语言能力多样化的研究效果,本文基于新媒体和智能数据处理技术,对应用语言学和外语学中的语言能力多样化进行了研究。在语言学习数据处理过程中,本文结合了邻接度和网络结构熵,提出了基于超网络的邻接结构熵方法来识别超网络中的关键节点。此外,本文将该指标应用于竞争性超网络中,准确地获取了超网络的关键节点。同时,本文构建了一个科学研究合作超网络,并将该超网络中的邻接结构熵方法应用于该数据集。实验研究表明,本文提出的算法在语言学和外语学中语言能力多样化分析中具有一定的作用。同时,本文提出的模型对应用语言学和外语学中语言能力的多样化也具有一定影响。
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
基于数据挖掘算法的高等学校物流服务管理研究
摘要为了提升大学物流在社会化改革过程中的自我发展能力,有必要构建一个能够适应新形势的大型物流服务系统(LS)。具体措施如下:在政府部门的支持下,营造良好的外部环境;以资源整合为目标,构建合理的组织结构;以市场机制为推动力,推动高等教育的创新发展。文中提到了一些通过数据挖掘(DM)算法进一步改革大学物流的参考方法,这些算法研究了物流实体与独立学院之间的市场特征及互动关系。物流服务数据挖掘(LS-DM)方法在推进物流管理科学的同时,还能提升整个经济的效益。随着高等教育的快速发展,新的需求和模式对大学物流管理提出了更高的要求。在新形势下,必须倡导并实施精细化管理。要实施精细化管理,需要改变管理理念,
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
\(D{S}^2L{C}^3Net\): 一种基于深度神经网络与基于正态分布的Gray Wolf优化算法融合的肺癌结肠癌分类决策支持系统
摘要肺癌和结直肠癌(LC)是威胁生命且发展迅速的癌症。根据世界卫生组织(WHO)的数据,每年约有414万新诊断的肺癌和结直肠癌病例,导致270万人死亡。国际癌症研究机构(IARC)报告称,2020年至2040年间全球结直肠癌病例将增加超过300万例。早期诊断对治疗非常有帮助,可以挽救宝贵的生命。传统的诊断方法费用高昂且耗时较长。在这项研究中,我们提出了一个准确高效的肺癌和结直肠癌分类模型。我们使用了两种知名的预训练深度学习模型——ResNet50和EfficientNetB0,并通过增加或减少层来对这两个模型进行微调。微调完成后,我们初始化了基于手动试验的超参数。随后进行了深度迁移学习,得到了
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
翻译平行语料库在口译教学中的应用研究
摘要大量且结构化的语言间翻译文本集合被称为平行翻译语料库(Parallel Translation Corpora,PTLs)。尽管数据驱动的学习方法可以从庞大的数据集中获取洞察并创造更加个性化的学习体验,但这种方法仍存在一些问题,如数据质量不佳、隐私担忧、难以扩展、缺乏清晰的解释以及成本高昂。为了提供高质量的输出,机器翻译算法通常使用由人类翻译员生成的平行语料库进行训练。书面文字可以通过翻译从一种语言转换成另一种语言;口语也可以通过翻译实现跨语言传递。基于对真实样本的研究,机器翻译系统利用语料库中的翻译结果来进行翻译。统计方法是利用语料库的众多方式之一。来自两种或多种语言的翻译文本构成了平行
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08
-
基于语义分析和粒度计算的高效低资源医疗信息处理
摘要数字经济的兴起和电子商务的发展推动了高效、低资源消耗的医疗信息处理技术的发展,这一趋势在医疗保健领域具有重要意义。糖尿病作为一种普遍的慢性疾病,使得血糖仪得以广泛应用,为患者提供了监测血糖水平的便捷方式。然而,值得注意的是,许多在线评论可能受到情感偏见的影响或包含不准确的信息。此外,血糖仪的性能受到多种因素的影响,包括价格、准确性和便携性,这可能会给消费者的决策过程带来复杂性。语义分析可以用来获取有价值的信息,帮助消费者合理选择合适的血糖仪。本文利用了细粒度计算(一种新兴的计算范式)的优势,有效处理不完整和不确定的医疗信息。通过使用广义模糊集、粗糙集和三支决策(TWD)技术来提高医疗信息融
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
时间:2025-11-08