





面对智能家居设备品类多、逻辑复杂、用户习惯多样的问题,小米提出 DevPiolt——首个真正落地的大模型 IoT 操作推荐系统。它专门解决设备操作逻辑复杂、用户偏好多样、推荐易出错的三大核心痛点,并已在小米 Home App 上大规模上线。
核心亮点
原生面向「设备操作逻辑」的 LLM 架构 论文指出传统推荐系统无法处理“设备 + 动作”的组合关系与先后逻辑(如先开插座再开空调)。DevPiolt 通过预训练吸收大规模真实操作序列,学习真实 IoT 操作规则。
高质量 IoT 操作数据模板 图 2 展示了统一的操作模板,包含时间、环境、描述、动作四元组,使原始日志可被大模型理解。
LoRA 微调 + 行为语义增强 微调阶段加入候选设备列表、环境数据,并采用“先生成 Action 再生成 Description”策略,显著提升准确率(表 4 显示 action-first 全指标优于 text-first)。
DPO 对齐用户真实偏好 图 6 显示了构造正/负样本的方法,模型学习避免冲突操作(如刚关空调却推荐再次开启),能理解时间敏感习惯(如清晨开窗帘)。
基于置信度的曝光控制避免“错误推荐” 图 7(a) 显示随着置信度提高,曝光下降但接受率上升。最终部署阈值为 0.7,使系统更稳健、不打扰用户。
大规模真实线上部署验证有效 DevPiolt 已在小米 Home 上线三个月: • UV 设备覆盖率 +21.6% • 操作建议接受率 +29.1% 是真正经过生产验证的 LLM-IoT 系统。
典型效果(来自表 2)
在 9 个子数据集上:
EM-Acc 平均提升 95.53%
LM-F1 提升 58.49%
Rule Score 提升 54.04%
尤其在多设备场景(11–20 台设备)仍保持明显优势。
arXiv: 2511.14227
#AI工具 #智能家居 #LLM #推荐系统 #IoT #大模型落地 #用户建模 #偏好学习 #自动化控制 #智能系统
核心亮点
原生面向「设备操作逻辑」的 LLM 架构 论文指出传统推荐系统无法处理“设备 + 动作”的组合关系与先后逻辑(如先开插座再开空调)。DevPiolt 通过预训练吸收大规模真实操作序列,学习真实 IoT 操作规则。
高质量 IoT 操作数据模板 图 2 展示了统一的操作模板,包含时间、环境、描述、动作四元组,使原始日志可被大模型理解。
LoRA 微调 + 行为语义增强 微调阶段加入候选设备列表、环境数据,并采用“先生成 Action 再生成 Description”策略,显著提升准确率(表 4 显示 action-first 全指标优于 text-first)。
DPO 对齐用户真实偏好 图 6 显示了构造正/负样本的方法,模型学习避免冲突操作(如刚关空调却推荐再次开启),能理解时间敏感习惯(如清晨开窗帘)。
基于置信度的曝光控制避免“错误推荐” 图 7(a) 显示随着置信度提高,曝光下降但接受率上升。最终部署阈值为 0.7,使系统更稳健、不打扰用户。
大规模真实线上部署验证有效 DevPiolt 已在小米 Home 上线三个月: • UV 设备覆盖率 +21.6% • 操作建议接受率 +29.1% 是真正经过生产验证的 LLM-IoT 系统。
典型效果(来自表 2)
在 9 个子数据集上:
EM-Acc 平均提升 95.53%
LM-F1 提升 58.49%
Rule Score 提升 54.04%
尤其在多设备场景(11–20 台设备)仍保持明显优势。
arXiv: 2511.14227
#AI工具 #智能家居 #LLM #推荐系统 #IoT #大模型落地 #用户建模 #偏好学习 #自动化控制 #智能系统
