eword.vn không chạy WordPress hay MySQL. Đây là hạ tầng tri thức bền vững: tri thức được lưu dạng file, index trước khi phục vụ, render ở edge — scale URL mà không scale hóa đơn server.
Năm lớp
1. Lưu trữ — Markdown trên R2
Mỗi mục từ, câu, bài so sánh là một file .md + metadata YAML. R2 là nguồn sự thật duy nhất — không ORM, không migration schema.
- Tra từ:
/tu-dien/budget· Markdown thô: /tu-dien/budget.md - Chính sách, giới thiệu: /pages/ dạng markdown tương tự
2. Index — Precomputed, không quét R2 lúc request
Worker không gọi list() trên R2 khi user tìm kiếm (tránh timeout). Mọi tra cứu nhanh dựa trên JSON build sẵn:
| File | Mục đích |
|---|---|
index-meta.json |
Hub CEFR, chủ đề, gate indexable |
suggest.json / suggest-vi.json |
Autocomplete Anh & Vi |
vi-en-index.json |
Learn Vietnamese (Vi→En) |
indexes/hub/ |
Hub /cau/, /so-sanh/ — phân trang |
indexes/cau-by-word/ |
Ngữ cảnh word×cau |
knowledge-graph.json |
Quan hệ ngữ nghĩa |
3. Render — Worker edge + Semantic CDN
Cloudflare Worker đọc .md hoặc index → HTML + JSON-LD @graph. Cache edge (Cache API), canonical luôn https://eword.vn — CDN cache ở mọi vùng nhưng Google chỉ thấy một URL gốc.
4. Ngữ nghĩa — Knowledge Graph
/knowledge-graph và JSON đầy đủ: đồng nghĩa, trái nghĩa, collocation, cặp so sánh. Google đọc entity graph, không phải 100k trang mỏng trùng lặp.
5. Pipeline — Build local, phục vụ global
Script Node build index → sitemap → upload R2. Control plane local (npm run cp) điều phối enrich, upload, sync GSC. Mọi job resume được (checkpoint) — chết giữa chừng không mất dữ liệu.
Scale không đốt tiền
- URL ảo
/ngu-canh/{word}/{cau}— hàng trăm nghìn trang ngữ cảnh không cần tạo.mdriêng - Gate chất lượng — chỉ từ có ≥2 ví dụ song ngữ mới index Google
- Chi phí hạ tầng ~$0/tháng — Worker + R2 free tier, không VPS 24/7
Cho developer & AI agent
- Manifest máy đọc: knowledge-manifest.json
- Chỉ dẫn LLM: llms.txt
- Sitemap: sitemap.xml
Wikipedia thế hệ mới
Entity-first, markdown, Knowledge Graph song ngữ: wikipedia-the-he-moi