Hengo

把签证时间窗、雇主担保资质和岗位匹配放进同一条求职流程。五位专科顾问、二十一个工具、一套公司情报管道，个人端到端构建。

在线预览 hengo.app

访问 Hengo →

Next.js 16Claude Agent SDKPrisma + PostgrespgvectorVoyageCapacitor

我的角色产品判断、系统设计、数据管道、前端原型

用户在英国找工作的国际毕业生

技术栈Next.js · Claude Agent SDK · Prisma · Postgres · pgvector

成果可运行原型 + 11 张系统架构图

第零章

国际学生求职最先卡住的不是简历措辞，而是资格约束。"这家公司是否可能担保"必须早于"这份工作是否匹配"。

0.1 我看到的事

国际学生在英国求职，最先卡住的往往不是简历措辞，而是资格约束：职场文化不透明、签证策略有时间窗、雇主能否担保难以判断。产品判断由此成立：对签证倒计时里的用户，“这家公司是否可能担保”要早于“这份工作是否匹配”。Hengo 先把英国移民局持证担保雇主名单和岗位数据对齐，再处理公司情报、简历复核、面试准备和职业策略。

0.2 市场里的同向产品

市场里已有几类同向产品。Jack & Jill 是 B2B 模式:候选人免费，雇主在成功录用后付费，核心是把候选人介绍给招聘经理。JobWizard AI、Tarve 和 gradjobs.ai 更偏签证岗位搜索与申请工具:围绕 sponsor register、薪资门槛、岗位订阅、auto-apply 和申请跟踪。ISCANET 面向 international talent，提供英国/美国 visa-sponsored jobs、CV 优化、cover letter 和面试工具。Reworkin 与 VisaAtlas 更偏 sponsor intelligence:先查雇主、城市、行业、SOC code 和 salary fit，再决定是否投入申请。Hengo 放在这个谱系里，关注签证可行性、岗位匹配、公司情报和顾问式对话怎样合成一条求职流程。

0.3 市场调研 — 三条渠道平行跑

产品路径来自三类平行研究:小红书还原真实焦虑和表达方式，访谈还原具体求职路径，专业资料校准市场规模和薪资/签证规则。访谈只问过去行为——不同来源的结论互相印证后，才进入产品设计。研究结果不是一张痛点清单，而是一个产品排序:先过滤不可行机会，再做匹配和建议。

第一章

用户看到的是一个对话框、五位专科顾问、跨次对话的记忆和一套岗位匹配结果。背后是两级路由、工具分发、上下文组装和三阶段匹配漏斗。

1.1 意图分发 · 两级路由

系统先判断消息语义，再激活对应专科顾问:签证、职业策略、简历、面试、职场适应。跨领域问题并行激活多位，最后合成一段回答。

图 1

一个问题可以同时触发多位顾问;未命中的顾问不参与本轮回答。

路由是一个成本漏斗:关键词先做便宜判断，拿不准时再让小模型兜底。这个思路在岗位匹配里会再次出现:先用规则缩小候选池，强模型只处理最后的短名单。

1.2 五位顾问 · 工具按角色分发

五位顾问面对五类问题:签证顾问处理担保资质和时间窗，职业策略师处理转岗路径和岗位筛选，简历优化师处理简历改写，面试教练处理题库和模拟反馈，职场指南处理入职与雇佣权利。它们共用一份工具注册表，但每位只领自己需要的工具子集。

1.3 岗位匹配 · 三阶段漏斗

图 2

先用规则和检索缩小范围，再让强模型解释短名单;高成本步骤只发生在最后。

第二阶段把关键词检索和语义检索放在一起用。关键词检索擅长抓"AWS"这类明确词;语义检索擅长抓"data scientist"和"machine learning engineer"这类近义岗位。两路结果先合并，再重排，避免因为某一种检索方式偏科而漏掉好岗位。

重排的作用是重新看一遍短名单:不是只看字面像不像，而是看"这个候选是否真的回答了用户的问题"。所以它只跑在前几十条候选上，不碰大候选池。

图 3

可变表达和硬规则分开维护:提示词调整不影响评分，规则调整不影响文案。

把"必须确定"的判断和"可以变化"的表达分开，带来一个具体好处:运行半年后想调整"无担保资质 → 减多少分"这条规则，只改一行代码;想调整"如何描述用户的匹配优势"，只改一段提示词。两类调整互不打扰，也不需要每改一次评分规则就跑一遍模型回归测试。

如果某条职位刚抓回来、还没完成向量索引，系统会走慢路径:跳过第二阶段检索，直接把候选交给模型解释。结果慢一点、范围小一点，但主流程不必因为索引延迟直接中断。

1.4 对话记忆 · 跨次记忆 + 单次上下文

顾问需要"记得"用户，但不能把所有历史消息塞进每次提示词。Hengo 把记忆分成两层:会话结束后提取结构化事实，写入用户画像;每次顾问回答前，系统读取画像、简历、近期对话、近期匹配和职业分析，整理成一段上下文。这样顾问能接上次的话，主对话也不会被后台任务拖慢。

图 4

记忆不是把原始聊天记录塞回模型，而是在回答前整理成一份可控上下文。

这些信息分工不同:画像和签证状态是硬事实，给规则和检索用;对话摘要让顾问接上上次语境;近期匹配反映用户最近几天的方向变化。分开存、分开查，最后并排交给顾问。

第二章

这一章说明公司情报、检索、数据采集、事实表和模型分层如何支撑前台体验。

2.1 公司情报 · 分视角调研

用户问"这家公司怎么样、面试流程难不难、文化怎么样"时，系统需要临时组织多源调研。Hengo 把任务拆成四个视角:公司画像看官方资料，员工体验看评论站点，求职情报看面试题集和招聘历史，近期动态看新闻和官方博客。

图 5

重点公司投入更多调研视角;长尾公司只保留最必要的两类信息。

并行的价值不只是速度，更重要的是视角隔离。官方公告、员工评论、面试经验和新闻动态各有偏差，分开采集后再合并，可以保留每类结论的来源边界。

调研结果还要经过引用检查:每条事实必须有出处链接;同一链接不能在同篇里重复凑数;整段至少覆盖 3 个独立域名。任一项不通过，整段重跑。检查由程序执行，不交给模型自评。

长尾公司会触发一次性采集任务。常规数据源覆盖不到时，系统为单家公司生成针对性的采集代码:读取页面结构、定位职位列表、抽取标题、地点和链接。代码只服务这家公司，跑完归档。这样避免为长尾场景维护过重的通用爬虫。

2.2 检索 · 四类资料放进同一语义空间

Hengo 没有为不同业务各建一个向量库，而是用同一个语义空间承载四类内容:知识片段、岗位片段、简历片段和公司情报片段。它们可以互相比较:简历技能对岗位技能，简历经历对公司文化，政策片段支撑签证解释。

图 6

同一语义空间可以复用，但检索时必须用片段类型和来源约束范围，避免技能、政策、文化互相串场。

入库和查询使用不同模型，是为了匹配不同成本结构。资料入库通常只做一次，质量优先;用户查询每次都要跑，速度和成本更重要。两端使用同一模型族，所以向量可以直接比较。

召回链路同时使用语义检索和关键词检索。语义检索适合找近义表达，关键词检索适合抓明确术语。两路结果按排名合并，避免只依赖一种检索方式。

召回后再用重排模型处理短名单。召回阶段快，但只能给出粗排序;重排阶段更慢，但能同时看到查询和候选文本，适合处理头部候选。下图展示同一查询在召回和重排后的顺序变化。

图 7

重排的目的不是换一个分数，而是把最贴近用户真实问题的材料提前。

重排会多一次模型调用，但只作用于头部候选。它提升最终进入回答的材料质量。第一章岗位匹配漏斗使用同一原则:先宽召回，再精排，最后只解释短名单。

还有几条保护:不同资料用不同相似度门槛;政策片段带生效日期;常见问题缓存查询向量;资料更新时覆盖旧向量，避免重复。

2.3 数据采集 · 17 家招聘系统直采 · 用户从平台直跳源站

Hengo 不做中间商，不把"投递"这个动作圈在自己平台里。用户在 Hengo 搜到岗位、看完公司情报、决定要投——点"申请"按钮后，浏览器跳到雇主自己的招聘页(Greenhouse / Ashby / Workday 等)，用户在源站完成投递。Hengo 既不代填表格，也不缓存岗位详情页的内容。这件事看着像放弃了一块业务，但它保住了"职位信息真实有效"这个底线:中间商缓存容易过时，过期岗位也是聚合站点上的常见问题。

图 8

产品层只保留一个动作:拉岗位;招聘系统差异封装在各自适配器里。

"直采"和"中间商"的区别看着小，实际上决定了岗位信息的时效性和真假。聚合器只用来发现线索:如果它告诉我们某家公司有新岗位，Hengo 会再回到雇主自己的招聘系统核对。用户看到的是源站链接，不是聚合器链接。

岗位还有状态维护的问题。雇主可能突然下架、招满、改地点。Hengo 给每条岗位维护三个状态：未知、活跃、休眠。每次重新采集时和上一次快照对比；如果连续 30 天没在源站列表里出现，状态就从活跃转为休眠，下次推荐时跳过。休眠岗位不立刻删除，因为它还能说明“这家公司过去招过这种岗位”。

数据采集这一层不是和 LinkedIn / Indeed / Glassdoor 比谁岗位多。Hengo 的重点是两件事:担保资质是否可信，岗位是否仍然有效。这两件事对签证求职者价值最大，对普通英国求职者也有帮助。

2.4 单一事实源 · 担保名单只维护一份

Hengo 对硬事实采用一个规则:同一件事只维护一份。最典型的是担保名单。英国移民局会发布完整的 sponsor register,Hengo 不把这份名单复制到岗位表、公司表或用户画像表里;所有需要判断"这家公司能不能担保"的地方，都回到这一张事实表查询。

图 9

担保资质只维护一份，避免不同页面因为缓存或复制产生冲突。

这样做会多一次查询，但能减少不同页面答案不一致。Hengo 的几个关键事实，例如担保名单、薪资门槛、公司注册状态，都跟权威源同步。权威源更新后，系统更新这一处即可。

例外是向量索引。长文档向量化贵且慢，所以会缓存。但缓存的是检索索引，不是业务结论。文档内容变了，就重新生成索引。

2.5 模型分层 · 便宜步骤用轻模型，关键步骤用强模型

模型分层不是一个新功能，而是一条成本纪律:先用便宜、快的模型处理大批量候选，只把少量重要材料交给强模型解释。

图 10

高频、大批量步骤用轻模型;少量关键材料才交给强模型。

具体分三层:资料入库时用更好的向量模型;用户每次提问时用更轻的模型先找候选;最终回答只处理筛过的短名单。后台批量任务可以用更便宜的模型，但出处链接、字段格式和可追溯性由程序检查。

这套分层把单位请求成本控制在可托管范围内。代价是工程复杂度上升:不同模型需要统一超时、降级和日志格式。收益是用户增长时成本曲线更可控。

第三章

前两章说明当前架构。这一章回到产品判断:原型证明了什么，下一步如何扩展，哪些工程设计还需要继续收敛。

3.1 反思 · 重 vs 轻 · 海外多国 · 商业模式

这个原型证明的是一套产品方向和系统架构:一个对话入口、五位专科顾问、四张向量内容表、并行公司情报调研、直采 + 状态机保鲜的数据层。线上演示在 hengo.app。下面是几个后续判断。

A. 重方向还是轻量化插件。当前架构偏重:自己采集、自己合成、自己保鲜。更轻的形态是浏览器插件，在 LinkedIn / Indeed / Glassdoor 上叠加担保资质、薪资分位和公司情报。重客户端适合深度筛选，插件适合日常浏览;两者可以共存。

B. 海外多国扩展。签证窗口、担保资质、薪资门槛和文化差异在加拿大、澳大利亚、德国、新加坡都有相似结构。换市场时，主要替换事实表和知识库语料，例如担保名单、薪资门槛、签证规则和本地职场文化。模型链路和检索结构可以保持稳定。

C. 商业模式 · 免费层 + 付费托管。免费层需要完成基本筛选和解释，付费层更适合做托管式服务:每日匹配新岗位、评分、微调简历、生成公司情报，并推送可行动清单。商业节奏应与签证时间窗对齐。

3.2 后续规划 · MCP 工具协议 · 把"咨询 → 投递 → 跟踪"串成一条线

当前 Hengo 主要覆盖咨询环节：回答问题、解释岗位、生成匹配清单。下一步是投递和跟踪。用户决定投递后，仍需要进入雇主网站、调整简历、写求职信草稿、跟踪邮件和面试时间。

后续规划是用 MCP(Model Context Protocol，模型上下文协议)串起这段流程。它的价值是让外部工具有统一接法:填表单、读邮箱、发邮件、查日历、看 PDF，不需要每接一个服务就重写一套临时对接代码。

图 11

MCP 的作用是统一外部工具接法，让投递和跟踪可以接入同一套顾问流程。

示例流程是:用户选中 3 个岗位后，系统按岗位调整简历重点段，生成求职信，预填招聘页标准字段，再交给用户确认。投递后，招聘方邮件进入求职信箱，系统分类为拒信、面试邀请或等待回复;面试邀请再与日历联动。

这一阶段的难点不在推理，而在权限和可追溯。读邮箱、发邮件、改简历都需要撤销、确认和审计日志。MCP 标准化工具调用后，后端可以统一记录和审计，比临时拼接多个外部服务更稳。

3.3 精进 · 可继续收敛的工程点

两级路由可以继续收敛。当前做法是先用关键词处理高确定性意图，再让小模型兜底模糊表达。它降低了高频请求成本，但需要持续维护关键词表。后续可以加入线上误召回样本，定期更新规则和分类提示词。

工具权限也需要继续硬化。Hengo 已经按顾问分发工具子集，避免所有 agent 看到完整工具箱。下一步可以把工具权限、调用日志和失败回放统一到后台，让越权、误调和空结果都能被追踪。

对话记忆目前采用离线抽取:主对话先回答，后台再从完整记录里抽结构化字段。这让主路径更轻，但结果通常到下一次会话才生效。对 Hengo 这类顾问型产品是可接受的;如果未来加入实时投递或日历动作，需要为关键字段增加同步确认。

检索还可以补一层评测。当前已有混合召回和重排，但不同来源的距离阈值仍需要人工校准。后续应建立小规模基准集，按签证政策、岗位技能、公司文化等来源分别评估召回率和误召回率。

缓存策略也需要分级。担保名单、薪资门槛、签证规则属于硬事实，应尽量读取当前事实表;公司画像和文化总结属于软合成，可以考虑带版本号的中期缓存。这样能在准确性和成本之间取得更清晰的边界。

MCP 规划的重点不是接入更多工具，而是权限模型。读邮箱、发邮件、改简历、提交表单都属于高影响动作，需要试运行、人工确认、撤销记录和审计日志。投递/跟踪功能上线前，应先把这套安全边界设计清楚。

引用来源

GOV.UK. Register of licensed sponsors: workers. Home Office 公开数据集。 gov.uk/register-of-licensed-sponsors-workers — 当前持有 Skilled Worker sponsor licence 的雇主权威名单，Hengo 签证双路径验证里的"被允许 sponsor"那一路。
GOV.UK. Skilled Worker caseworker guidance(Home Office)。 gov.uk/skilled-worker-caseworker-guidance — 2026 年 Skilled Worker salary thresholds（£41,700 / £37,500 / £33,400 / £31,300 / £28,200 / £25,000）与 SOC going-rate 规则的权威来源。
Companies House. Public data API. developer-specs.company-information.service.gov.uk — 英国公司注册局公开 API，公司情报 Pipeline V7 拿官方注册数据(公司编号、行业代码、状态、地址)的来源。
Voyage AI. The Voyage 4 model family: shared embedding space with MoE architecture. blog.voyageai.com/2026/01/15/voyage-4 — 非对称检索:入库 voyage-4-large、查询 voyage-4-lite，共享 1024 维向量空间。
Cormack, Clarke, Buettcher. Reciprocal Rank Fusion outperforms Condorcet and individual Rank Learning Methods. SIGIR 2009。 cormack.uwaterloo.ca/cormacksigir09-rrf.pdf — RRF 混合排名的原始论文，Hengo 用它合并向量召回和 BM25 关键词召回。
pgvector. Open-source vector similarity search for Postgres. github.com/pgvector/pgvector — PostgreSQL 向量扩展，余弦距离阈值检索。
Microsoft. Playwright. 官方文档。 playwright.dev — 跨浏览器自动化框架，3 层 ATS 检测里的兜底层。
Robert Half / Hays / Reed. 2026 年英国薪酬调研。 — KnowledgeChunk 表里的薪资片段主要来源，每条结论挂具体报告的页码。
CIPD. 英国人力资源实务报告。 cipd.org/uk — 知识库职场文化、雇佣实务类片段的来源。
HESA / Department for Education. Higher education student enrolments UK: 2024 to 2025. gov.uk/higher-education-student-enrolments-uk-2024-to-2025 — 国际学生统计，市场理解的分母。
Anthropic. Building Effective Agents. Engineering blog，2024 年 12 月。 anthropic.com/engineering/building-effective-agents — routing 模式的官方描述，Hengo 的两层路由从这里出发。
Anthropic. How we built our multi-agent research system. Engineering blog. anthropic.com/engineering/built-multi-agent-research-system — 专门支撑公司情报 Pipeline 里"子任务隔离、并行探索、最后合并"这个设计判断。