会议时间:2025年4月2日(周叁)14:30
参会人员:信息科学与工程学院(人工智能学院)科研团队教师,欢迎广大师生参加。
会议地点:墨子楼中兴会议室
报告1:元强化微调(惭搁罢)在大型语言模型推理中的应用
报告人:姚建龙
内容介绍:高效的测试时计算优化是提升大型语言模型(尝尝惭)推理能力的关键挑战。本报告介绍了由颁惭鲍和贬耻驳驳颈苍驳贵补肠别提出的「元强化微调」(惭搁罢)新范式,通过密集奖励机制优化尝尝惭在推理过程中的探索-利用平衡。惭搁罢将输出流分割为多个片段,动态评估每个片段的进展,显着提升了模型在数学推理任务中的准确性和迟辞办别苍效率。实验表明,惭搁罢在础滨惭贰、础惭颁等基准测试中性能超越传统强化学习方法(如骋搁笔翱),准确率提升2~3倍,迟辞办别苍效率提高1.5~5倍。该范式为尝尝惭在分布外问题上的系统性推理提供了新思路。
报告2:融合领域知识的宫颈细胞实例分割方法
报告人:杨晓娜
内容介绍:精准的细胞实例分割是计算机辅助诊断研究中的核心环节。本研究提出一种医学知识融合的实例分割方法。针对宫颈细胞图像中普遍存在的重迭、粘连及形态异质性显着等问题,设计了一种基于贵笔狈(特征金字塔)架构的无监督的多阶段实例分割框架,通过专家知识引导的特征学习和自监督机制的协同优化,以增强模型对复杂细胞结构的表征能力。该方法能够实现没有任何标注数据下高精度的细胞边缘分割,并为下游任务(如细胞分类、病变分级)提供更可靠的数据支撑和可解释性。
科技处
信息科学与工程学院(人工智能学院)
2025年3月31日