Hengo
把签证时间窗、雇主担保资质和岗位匹配放进同一条求职流程。五位专科顾问、二十一个工具、一套公司情报管道,个人端到端构建。
第零章
国际学生求职最先卡住的不是简历措辞,而是资格约束。"这家公司是否可能担保"必须早于"这份工作是否匹配"。
0.1 我看到的事
国际学生在英国求职,最先卡住的往往不是简历措辞,而是资格约束:职场文化不透明、签证策略有时间窗、雇主能否担保难以判断。产品判断由此成立:对签证倒计时里的用户,“这家公司是否可能担保”要早于“这份工作是否匹配”。Hengo 先把英国移民局持证担保雇主名单和岗位数据对齐,再处理公司情报、简历复核、面试准备和职业策略。
0.2 市场里的同向产品
市场里已有几类同向产品。Jack & Jill 是 B2B 模式:候选人免费,雇主在成功录用后付费,核心是把候选人介绍给招聘经理。JobWizard AI、Tarve 和 gradjobs.ai 更偏签证岗位搜索与申请工具:围绕 sponsor register、薪资门槛、岗位订阅、auto-apply 和申请跟踪。ISCANET 面向 international talent,提供英国/美国 visa-sponsored jobs、CV 优化、cover letter 和面试工具。Reworkin 与 VisaAtlas 更偏 sponsor intelligence:先查雇主、城市、行业、SOC code 和 salary fit,再决定是否投入申请。Hengo 放在这个谱系里,关注签证可行性、岗位匹配、公司情报和顾问式对话怎样合成一条求职流程。
0.3 市场调研 — 三条渠道平行跑
产品路径来自三类平行研究:小红书还原真实焦虑和表达方式,访谈还原具体求职路径,专业资料校准市场规模和薪资/签证规则。访谈只问过去行为——不同来源的结论互相印证后,才进入产品设计。研究结果不是一张痛点清单,而是一个产品排序:先过滤不可行机会,再做匹配和建议。
第一章
用户看到的是一个对话框、五位专科顾问、跨次对话的记忆和一套岗位匹配结果。背后是两级路由、工具分发、上下文组装和三阶段匹配漏斗。
1.1 意图分发 · 两级路由
系统先判断消息语义,再激活对应专科顾问:签证、职业策略、简历、面试、职场适应。跨领域问题并行激活多位,最后合成一段回答。
- 一个问题可以同时触发多位顾问;未命中的顾问不参与本轮回答。
路由是一个成本漏斗:关键词先做便宜判断,拿不准时再让小模型兜底。这个思路在岗位匹配里会再次出现:先用规则缩小候选池,强模型只处理最后的短名单。
1.2 五位顾问 · 工具按角色分发
五位顾问面对五类问题:签证顾问处理担保资质和时间窗,职业策略师处理转岗路径和岗位筛选,简历优化师处理简历改写,面试教练处理题库和模拟反馈,职场指南处理入职与雇佣权利。它们共用一份工具注册表,但每位只领自己需要的工具子集。
1.3 岗位匹配 · 三阶段漏斗
- 先用规则和检索缩小范围,再让强模型解释短名单;高成本步骤只发生在最后。
第二阶段把关键词检索和语义检索放在一起用。关键词检索擅长抓"AWS"这类明确词;语义检索擅长抓"data scientist"和"machine learning engineer"这类近义岗位。两路结果先合并,再重排,避免因为某一种检索方式偏科而漏掉好岗位。
重排的作用是重新看一遍短名单:不是只看字面像不像,而是看"这个候选是否真的回答了用户的问题"。所以它只跑在前几十条候选上,不碰大候选池。
- 可变表达和硬规则分开维护:提示词调整不影响评分,规则调整不影响文案。
把"必须确定"的判断和"可以变化"的表达分开,带来一个具体好处:运行半年后想调整"无担保资质 → 减多少分"这条规则,只改一行代码;想调整"如何描述用户的匹配优势",只改一段提示词。两类调整互不打扰,也不需要每改一次评分规则就跑一遍模型回归测试。
如果某条职位刚抓回来、还没完成向量索引,系统会走慢路径:跳过第二阶段检索,直接把候选交给模型解释。结果慢一点、范围小一点,但主流程不必因为索引延迟直接中断。
1.4 对话记忆 · 跨次记忆 + 单次上下文
顾问需要"记得"用户,但不能把所有历史消息塞进每次提示词。Hengo 把记忆分成两层:会话结束后提取结构化事实,写入用户画像;每次顾问回答前,系统读取画像、简历、近期对话、近期匹配和职业分析,整理成一段上下文。这样顾问能接上次的话,主对话也不会被后台任务拖慢。
- 记忆不是把原始聊天记录塞回模型,而是在回答前整理成一份可控上下文。
这些信息分工不同:画像和签证状态是硬事实,给规则和检索用;对话摘要让顾问接上上次语境;近期匹配反映用户最近几天的方向变化。分开存、分开查,最后并排交给顾问。
第二章
这一章说明公司情报、检索、数据采集、事实表和模型分层如何支撑前台体验。
2.1 公司情报 · 分视角调研
用户问"这家公司怎么样、面试流程难不难、文化怎么样"时,系统需要临时组织多源调研。Hengo 把任务拆成四个视角:公司画像看官方资料,员工体验看评论站点,求职情报看面试题集和招聘历史,近期动态看新闻和官方博客。
- 重点公司投入更多调研视角;长尾公司只保留最必要的两类信息。
并行的价值不只是速度,更重要的是视角隔离。官方公告、员工评论、面试经验和新闻动态各有偏差,分开采集后再合并,可以保留每类结论的来源边界。
调研结果还要经过引用检查:每条事实必须有出处链接;同一链接不能在同篇里重复凑数;整段至少覆盖 3 个独立域名。任一项不通过,整段重跑。检查由程序执行,不交给模型自评。
长尾公司会触发一次性采集任务。常规数据源覆盖不到时,系统为单家公司生成针对性的采集代码:读取页面结构、定位职位列表、抽取标题、地点和链接。代码只服务这家公司,跑完归档。这样避免为长尾场景维护过重的通用爬虫。
2.2 检索 · 四类资料放进同一语义空间
Hengo 没有为不同业务各建一个向量库,而是用同一个语义空间承载四类内容:知识片段、岗位片段、简历片段和公司情报片段。它们可以互相比较:简历技能对岗位技能,简历经历对公司文化,政策片段支撑签证解释。
- 同一语义空间可以复用,但检索时必须用片段类型和来源约束范围,避免技能、政策、文化互相串场。
入库和查询使用不同模型,是为了匹配不同成本结构。资料入库通常只做一次,质量优先;用户查询每次都要跑,速度和成本更重要。两端使用同一模型族,所以向量可以直接比较。
召回链路同时使用语义检索和关键词检索。语义检索适合找近义表达,关键词检索适合抓明确术语。两路结果按排名合并,避免只依赖一种检索方式。
召回后再用重排模型处理短名单。召回阶段快,但只能给出粗排序;重排阶段更慢,但能同时看到查询和候选文本,适合处理头部候选。下图展示同一查询在召回和重排后的顺序变化。
- 重排的目的不是换一个分数,而是把最贴近用户真实问题的材料提前。
重排会多一次模型调用,但只作用于头部候选。它提升最终进入回答的材料质量。第一章岗位匹配漏斗使用同一原则:先宽召回,再精排,最后只解释短名单。
还有几条保护:不同资料用不同相似度门槛;政策片段带生效日期;常见问题缓存查询向量;资料更新时覆盖旧向量,避免重复。
2.3 数据采集 · 17 家招聘系统直采 · 用户从平台直跳源站
Hengo 不做中间商,不把"投递"这个动作圈在自己平台里。用户在 Hengo 搜到岗位、看完公司情报、决定要投——点"申请"按钮后,浏览器跳到雇主自己的招聘页(Greenhouse / Ashby / Workday 等),用户在源站完成投递。Hengo 既不代填表格,也不缓存岗位详情页的内容。这件事看着像放弃了一块业务,但它保住了"职位信息真实有效"这个底线:中间商缓存容易过时,过期岗位也是聚合站点上的常见问题。
- 产品层只保留一个动作:拉岗位;招聘系统差异封装在各自适配器里。
"直采"和"中间商"的区别看着小,实际上决定了岗位信息的时效性和真假。聚合器只用来发现线索:如果它告诉我们某家公司有新岗位,Hengo 会再回到雇主自己的招聘系统核对。用户看到的是源站链接,不是聚合器链接。
岗位还有状态维护的问题。雇主可能突然下架、招满、改地点。Hengo 给每条岗位维护三个状态:未知、活跃、休眠。每次重新采集时和上一次快照对比;如果连续 30 天没在源站列表里出现,状态就从活跃转为休眠,下次推荐时跳过。休眠岗位不立刻删除,因为它还能说明“这家公司过去招过这种岗位”。
数据采集这一层不是和 LinkedIn / Indeed / Glassdoor 比谁岗位多。Hengo 的重点是两件事:担保资质是否可信,岗位是否仍然有效。这两件事对签证求职者价值最大,对普通英国求职者也有帮助。
2.4 单一事实源 · 担保名单只维护一份
Hengo 对硬事实采用一个规则:同一件事只维护一份。最典型的是担保名单。英国移民局会发布完整的 sponsor register,Hengo 不把这份名单复制到岗位表、公司表或用户画像表里;所有需要判断"这家公司能不能担保"的地方,都回到这一张事实表查询。
- 担保资质只维护一份,避免不同页面因为缓存或复制产生冲突。
这样做会多一次查询,但能减少不同页面答案不一致。Hengo 的几个关键事实,例如担保名单、薪资门槛、公司注册状态,都跟权威源同步。权威源更新后,系统更新这一处即可。
例外是向量索引。长文档向量化贵且慢,所以会缓存。但缓存的是检索索引,不是业务结论。文档内容变了,就重新生成索引。
2.5 模型分层 · 便宜步骤用轻模型,关键步骤用强模型
模型分层不是一个新功能,而是一条成本纪律:先用便宜、快的模型处理大批量候选,只把少量重要材料交给强模型解释。
- 高频、大批量步骤用轻模型;少量关键材料才交给强模型。
具体分三层:资料入库时用更好的向量模型;用户每次提问时用更轻的模型先找候选;最终回答只处理筛过的短名单。后台批量任务可以用更便宜的模型,但出处链接、字段格式和可追溯性由程序检查。
这套分层把单位请求成本控制在可托管范围内。代价是工程复杂度上升:不同模型需要统一超时、降级和日志格式。收益是用户增长时成本曲线更可控。
第三章
前两章说明当前架构。这一章回到产品判断:原型证明了什么,下一步如何扩展,哪些工程设计还需要继续收敛。
3.1 反思 · 重 vs 轻 · 海外多国 · 商业模式
这个原型证明的是一套产品方向和系统架构:一个对话入口、五位专科顾问、四张向量内容表、并行公司情报调研、直采 + 状态机保鲜的数据层。线上演示在 hengo.app。下面是几个后续判断。
A. 重方向还是轻量化插件。当前架构偏重:自己采集、自己合成、自己保鲜。更轻的形态是浏览器插件,在 LinkedIn / Indeed / Glassdoor 上叠加担保资质、薪资分位和公司情报。重客户端适合深度筛选,插件适合日常浏览;两者可以共存。
B. 海外多国扩展。签证窗口、担保资质、薪资门槛和文化差异在加拿大、澳大利亚、德国、新加坡都有相似结构。换市场时,主要替换事实表和知识库语料,例如担保名单、薪资门槛、签证规则和本地职场文化。模型链路和检索结构可以保持稳定。
C. 商业模式 · 免费层 + 付费托管。免费层需要完成基本筛选和解释,付费层更适合做托管式服务:每日匹配新岗位、评分、微调简历、生成公司情报,并推送可行动清单。商业节奏应与签证时间窗对齐。
3.2 后续规划 · MCP 工具协议 · 把"咨询 → 投递 → 跟踪"串成一条线
当前 Hengo 主要覆盖咨询环节:回答问题、解释岗位、生成匹配清单。下一步是投递和跟踪。用户决定投递后,仍需要进入雇主网站、调整简历、写求职信草稿、跟踪邮件和面试时间。
后续规划是用 MCP(Model Context Protocol,模型上下文协议)串起这段流程。它的价值是让外部工具有统一接法:填表单、读邮箱、发邮件、查日历、看 PDF,不需要每接一个服务就重写一套临时对接代码。
- MCP 的作用是统一外部工具接法,让投递和跟踪可以接入同一套顾问流程。
示例流程是:用户选中 3 个岗位后,系统按岗位调整简历重点段,生成求职信,预填招聘页标准字段,再交给用户确认。投递后,招聘方邮件进入求职信箱,系统分类为拒信、面试邀请或等待回复;面试邀请再与日历联动。
这一阶段的难点不在推理,而在权限和可追溯。读邮箱、发邮件、改简历都需要撤销、确认和审计日志。MCP 标准化工具调用后,后端可以统一记录和审计,比临时拼接多个外部服务更稳。
3.3 精进 · 可继续收敛的工程点
两级路由可以继续收敛。当前做法是先用关键词处理高确定性意图,再让小模型兜底模糊表达。它降低了高频请求成本,但需要持续维护关键词表。后续可以加入线上误召回样本,定期更新规则和分类提示词。
工具权限也需要继续硬化。Hengo 已经按顾问分发工具子集,避免所有 agent 看到完整工具箱。下一步可以把工具权限、调用日志和失败回放统一到后台,让越权、误调和空结果都能被追踪。
对话记忆目前采用离线抽取:主对话先回答,后台再从完整记录里抽结构化字段。这让主路径更轻,但结果通常到下一次会话才生效。对 Hengo 这类顾问型产品是可接受的;如果未来加入实时投递或日历动作,需要为关键字段增加同步确认。
检索还可以补一层评测。当前已有混合召回和重排,但不同来源的距离阈值仍需要人工校准。后续应建立小规模基准集,按签证政策、岗位技能、公司文化等来源分别评估召回率和误召回率。
缓存策略也需要分级。担保名单、薪资门槛、签证规则属于硬事实,应尽量读取当前事实表;公司画像和文化总结属于软合成,可以考虑带版本号的中期缓存。这样能在准确性和成本之间取得更清晰的边界。
MCP 规划的重点不是接入更多工具,而是权限模型。读邮箱、发邮件、改简历、提交表单都属于高影响动作,需要试运行、人工确认、撤销记录和审计日志。投递/跟踪功能上线前,应先把这套安全边界设计清楚。
引用来源
- GOV.UK. Register of licensed sponsors: workers. Home Office 公开数据集。 gov.uk/register-of-licensed-sponsors-workers — 当前持有 Skilled Worker sponsor licence 的雇主权威名单,Hengo 签证双路径验证里的"被允许 sponsor"那一路。
- GOV.UK. Skilled Worker caseworker guidance(Home Office)。 gov.uk/skilled-worker-caseworker-guidance — 2026 年 Skilled Worker salary thresholds(£41,700 / £37,500 / £33,400 / £31,300 / £28,200 / £25,000)与 SOC going-rate 规则的权威来源。
- Companies House. Public data API. developer-specs.company-information.service.gov.uk — 英国公司注册局公开 API,公司情报 Pipeline V7 拿官方注册数据(公司编号、行业代码、状态、地址)的来源。
- Voyage AI. The Voyage 4 model family: shared embedding space with MoE architecture. blog.voyageai.com/2026/01/15/voyage-4 — 非对称检索:入库 voyage-4-large、查询 voyage-4-lite,共享 1024 维向量空间。
- Cormack, Clarke, Buettcher. Reciprocal Rank Fusion outperforms Condorcet and individual Rank Learning Methods. SIGIR 2009。 cormack.uwaterloo.ca/cormacksigir09-rrf.pdf — RRF 混合排名的原始论文,Hengo 用它合并向量召回和 BM25 关键词召回。
- pgvector. Open-source vector similarity search for Postgres. github.com/pgvector/pgvector — PostgreSQL 向量扩展,余弦距离阈值检索。
- Microsoft. Playwright. 官方文档。 playwright.dev — 跨浏览器自动化框架,3 层 ATS 检测里的兜底层。
- Robert Half / Hays / Reed. 2026 年英国薪酬调研。 —
KnowledgeChunk表里的薪资片段主要来源,每条结论挂具体报告的页码。 - CIPD. 英国人力资源实务报告。 cipd.org/uk — 知识库职场文化、雇佣实务类片段的来源。
- HESA / Department for Education. Higher education student enrolments UK: 2024 to 2025. gov.uk/higher-education-student-enrolments-uk-2024-to-2025 — 国际学生统计,市场理解的分母。
- Anthropic. Building Effective Agents. Engineering blog,2024 年 12 月。 anthropic.com/engineering/building-effective-agents — routing 模式的官方描述,Hengo 的两层路由从这里出发。
- Anthropic. How we built our multi-agent research system. Engineering blog. anthropic.com/engineering/built-multi-agent-research-system — 专门支撑公司情报 Pipeline 里"子任务隔离、并行探索、最后合并"这个设计判断。