Lowan -- 邏輯萬國語

Lowan is a project for the Lojban artificial language.

邏輯萬國語計畫是為「邏輯語」這個人造語言所創建的一個計畫。

If you can read chinese , you may read the following slide to understand why the project started.

如果您能閱讀中文(漢語)，您可以閱讀下列簡報，以瞭解這個計畫的起源。

程式人為何學邏輯語 Lojban ?

We target to build a set of tools for Lojban multilingual applications , include kowledge base in JSON format (KB), multilingual machine translation (MT) , information retrieval (IR), multilingual wiki system (include editor) for lojban (WS), and the other tools and application that may be useful for Lojban users.

我們企圖建立一組專為邏輯語設計的工具與應用，包含知識庫(KB)、多語言機器翻譯(MT)、資訊檢索(IR)、維基系統 (WS) 以及其他對邏輯語使用者有幫助的工具與應用。

We hope the project may help the widespreading of Lojban, and let more people know, learn, speak and write in Lojban.

我們希望這個計畫對邏輯語的推廣會有幫助，並且希望能讓更多人知道與學習邏輯語，並且採用邏輯語來書寫或交談。

KB 知識庫

在邏輯語官方網站中有各國語言對邏輯語的翻譯字典檔。

我們下載了其中的英文和中文版本，分別儲存在 dictionary/xml-export_english.html 與 dictionary/xml-export_chinese.html 底下。

有關字典的進一步內容，請參考邏輯語的 XML 字典結構。

為了讓後續的程式能很方便的使用這些字典資源，我們寫了一個 kb/kbBuild.js 的程式，用來將這些資源整理成比較好用的 JSON 格式知識庫。

我們撰寫了一個稱為 xml2json() 的函數，可以將 XML 字典中的翻譯表抽出，並轉換成 JSON 格式儲存，於是我們只要撰寫下列兩行程式，就可以分別將英文與中文字典轉換成 JSON 儲存。

xml2json("../dictionary/xml-export_english.html", "e2l.json", "l2e.json");
xml2json("../dictionary/xml-export_chinese.html", "c2l.json", "l2c.json");

若您使用 JavaScript 撰寫程式，您只要用 JSON.parse("e2l.json") 這樣的指令就能將字典載入並使用。

目前轉換出來的字典共有四個檔案，分別是 kb/l2e.json (邏翻英), kb/l2c.json (邏翻中), kb/e2l.json (英翻邏) , kb/c2l.json (中翻邏) 等，其中英文版的字很多，但是中文版的字就很少，因此建議使用英文版為主。

您可以用下列指令建構這些 JSON 字典。

$ cd kb
$ node kbBuild.js

建構出來的字典格式如下：

{
"a":"and/or",
"a":"or",
"a":"sumti or",
"a'a":"attentive",
"a'acu'i":"inattentive",
"a'anai":"avoiding",
"a'au":"attitudal: moved",
...

另外、我們還下載了一個維基百科某詞頻表，並用 google 翻譯翻成了中英對照的模式，儲存在 kb/e2c.json 這個檔案中，讓我們可以透過「邏翻英+英翻中」的方式，間接地完成「邏翻中」的功能。

MT 翻譯系統

在 /mt/ 資料夾中存放有邏輯語的翻譯系統，目前已經建構好(邏翻英) 的部分，等到成熟一點再開始考慮 (邏翻中) 的部分。

您可以在下列網址中看到此翻譯系統的線上展示。

https://ccc.nqu.edu.tw/web/lowan/mt/lmt.html

parser 剖析器 (採用 camxes.js)

在 /parser/ 資料夾中有 parser.js ，是我們將 lojban 官網中推薦的 camxes.js 程式轉成 node.js 模組後，用來進行剖析 (parsing) 的程式。

parser.js 的用法如下：

$ node parser "mi klama vi vu"            ==> 印出完整語法樹
$ node parser "mi klama vi vu" -s         ==> 印出簡化語法樹```
$ node parser "mi klama vi vu" -s -pretty ==> 印出有縮排的簡化語法樹
$ node parser "mi klama klama vi vu le"   ==> 傳回錯誤
$ node parser lojban1.txt -f -s           ==> 讀檔後印出簡化語法樹

執行範例：

D:\Dropbox\cccwd\web\lowan\parser>node parser "mi klama klama mi vu le"
ltext=mi klama klama mi vu le
error={"name":"SyntaxError","expected":[],"found":"l","message":"Expected end of
 input but \"l\" found.","offset":21,"line":1,"column":22}
================================
tree=undefined

D:\Dropbox\cccwd\web\lowan\parser>node parser "mi klama mi vu" -s -pretty
ltext=mi klama mi vu
error=undefined
================================
tree=[
  "sentence",
  [
    [
      [
        "KOhA",
        "mi"
      ]
    ]
  ],
  [
    "bridi_tail_3",
    [
      [
        "gismu",
        "klama"
      ]
    ],
    [
      "terms",
      [
        [
          "KOhA",
          "mi"
        ]
      ],
      [
        [
          "VA",
          "vu"
        ]
      ]
    ]
  ]
]

很可惜的是，camxes.js 非常慢，用來 parse 的速度超慢，光是一個北風與太陽的 200 字小故事，竟然要花五秒鐘。

我們應該會將 camxes.js.peg 改寫為 BNF，然後用 jison 來產生新的 parser。

這裡居然有邏輯語的 yacc 語法，這樣就可以很容易的餵給 jison 產生 parser 了。

http://www.lojban.org/publications/formal-grammars/grammar.300.txt

展望

目前其他部分尚未完成，專案還在進行當中 ....

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
dictionary		dictionary
kb		kb
mt		mt
parser		parser
web		web
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
package.json		package.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Lowan -- 邏輯萬國語

KB 知識庫

MT 翻譯系統

parser 剖析器 (採用 camxes.js)

展望

About

Releases

Packages

Languages

License

ccckmit/lowan

Folders and files

Latest commit

History

Repository files navigation

Lowan -- 邏輯萬國語

KB 知識庫

MT 翻譯系統

parser 剖析器 (採用 camxes.js)

展望

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages