eword.vn

Hạ tầng tri thức bền vững

</> .md

eword.vn không chạy WordPress hay MySQL. Đây là hạ tầng tri thức bền vững: tri thức được lưu dạng file, index trước khi phục vụ, render ở edge — scale URL mà không scale hóa đơn server.

Năm lớp

1. Lưu trữ — Markdown trên R2

Mỗi mục từ, câu, bài so sánh là một file .md + metadata YAML. R2 là nguồn sự thật duy nhất — không ORM, không migration schema.

  • Tra từ: /tu-dien/budget · Markdown thô: /tu-dien/budget.md
  • Chính sách, giới thiệu: /pages/ dạng markdown tương tự

2. Index — Precomputed, không quét R2 lúc request

Worker không gọi list() trên R2 khi user tìm kiếm (tránh timeout). Mọi tra cứu nhanh dựa trên JSON build sẵn:

File Mục đích
index-meta.json Hub CEFR, chủ đề, gate indexable
suggest.json / suggest-vi.json Autocomplete Anh & Vi
vi-en-index.json Learn Vietnamese (Vi→En)
indexes/hub/ Hub /cau/, /so-sanh/ — phân trang
indexes/cau-by-word/ Ngữ cảnh word×cau
knowledge-graph.json Quan hệ ngữ nghĩa

3. Render — Worker edge + Semantic CDN

Cloudflare Worker đọc .md hoặc index → HTML + JSON-LD @graph. Cache edge (Cache API), canonical luôn https://eword.vn — CDN cache ở mọi vùng nhưng Google chỉ thấy một URL gốc.

4. Ngữ nghĩa — Knowledge Graph

/knowledge-graphJSON đầy đủ: đồng nghĩa, trái nghĩa, collocation, cặp so sánh. Google đọc entity graph, không phải 100k trang mỏng trùng lặp.

5. Pipeline — Build local, phục vụ global

Script Node build index → sitemap → upload R2. Control plane local (npm run cp) điều phối enrich, upload, sync GSC. Mọi job resume được (checkpoint) — chết giữa chừng không mất dữ liệu.

Scale không đốt tiền

  • URL ảo /ngu-canh/{word}/{cau} — hàng trăm nghìn trang ngữ cảnh không cần tạo .md riêng
  • Gate chất lượng — chỉ từ có ≥2 ví dụ song ngữ mới index Google
  • Chi phí hạ tầng ~$0/tháng — Worker + R2 free tier, không VPS 24/7

Cho developer & AI agent

Wikipedia thế hệ mới

Entity-first, markdown, Knowledge Graph song ngữ: wikipedia-the-he-moi