6月12日,夸克发布了国内首个针对高考志愿填报场景开发的高考志愿大模型,并推出了“高考深度搜索”、“志愿报告”和“智能选志愿”三大核心功能。这款模型能够提供精准、个性化的志愿填报服务。
夸克“志愿报告”以Agent方式运行,采用“任务规划—执行—检查—反思”的链式推理流程,自动输出包含冲稳保策略、志愿表及院校专业推荐等内容的完整报告。每轮执行结果会经过自动检查,判断是否存在逻辑冲突、数据缺漏或排序异常等问题,并将结果反馈至“反思”模块进行优化。
该模型基于通义千问为基座,利用领域数据优势进行了专项训练,具备对复杂规则与用户需求的理解与推理能力。例如,当考生倾向于选择省内且要求985院校时,如果省内符合条件的学校较少,模型会尝试推荐适合的外省985高校。
在构建过程中,夸克高考志愿大模型融合了自监督语义建模、监督式对齐调优以及由专家判别价值引导的策略精化机制。指令微调阶段,通过结构化数百名资深高考志愿规划师的沟通决策过程,提取出完整的分析路径与语言风格,从而让模型深入学习人类专家的分析方法。
此外,夸克高考志愿大模型还生成了中间可验证结构,在复杂推理任务中降低了幻觉率,增强了跨模态演绎能力和分布外泛化鲁棒性,有助于解决需要专业知识的复杂问题。
为了进一步提高模型的专业度与匹配度,夸克团队引入了基于人类偏好强化学习(RLHF)的方法来精化策略层,形成了一个闭环优化机制。模型根据模拟考生档案生成志愿填报方案,再提交给多位高考志愿专家评估。这些评估标准涵盖专业建议准确性、排序逻辑合理性、分数与兴趣平衡以及风险提示等方面。通过“人类挑刺+模型修正”的方式,使模型输出更加贴近专家的真实判断标准。
主题测试文章,只做测试使用。发布者:大众参考网,转转请注明出处:https://www.jjrbwx.com/17013.html