Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
标 注 数 据 生 成 (Data Labeling)<br />
• 显 式 标 注<br />
• 对 每 一 个 查 询 , 人 工 检 查 文 档 的 相 关 性<br />
• 代 价 高 ( 钱 + 时 间 )<br />
• 噪 声 大<br />
• 隐 式 标 注<br />
• 从 用 户 点 击 记 录 (query log) 里 抽 取 数 据 标 注<br />
‣ 用 户 总 是 习 惯 于 从 上 到 下 浏 览 搜 索 结 果<br />
‣ 如 果 用 户 跳 过 了 排 在 前 面 的 文 档 而 点 击 浏 览 了 排 在 后 面 的 文<br />
档 , 那 么 排 在 后 面 的 文 档 就 比 排 在 前 面 的 文 档 更 相 关<br />
• 用 户 点 击 有 比 较 大 的 噪 声<br />
• 只 有 头 查 询 (head query) 才 存 在 用 户 点 击