| Tiến Tŕnh Thực Hiện Bộ Tự Điển Điện Toán 
Ca Dao Trong nỗ lực mong đóng góp một chút tài mọn để bảo tồn Văn Hóa Việt mà Văn Chương B́nh Dân 
giữ một vai tṛ tối ư quan trọng, cho nên 
trong bốn năm liền, tôi đă cố gắng góp nhặt ca dao, tục ngữ, thành ngữ, dân ca v.v. từ sách báo 
cũng như 
truyện rồi đưa vào Access Database để chờ ngày đưa lên Mạng Lưới Toàn Cầu hầu 
làm một phương tiện tra cứu hữu hiệu cho mọi giới. Làm xong Database th́ tôi vấp 
phải trở ngại lớn lao là kỹ thuật đưa lên NET cũng như 
t́m một dạng mă phổ thông để ai 
ai cũng có thể đọc đươc. Muốn thực hiện được dự án nầy tôi phải tầm sư học 
chưởng pháp ASP, một ứng dụng (application) để ta có thể truy lục dữ kiện tàng 
chứa trong Database từ một Server nào đó. Học ASP quá khó v́ các sách dạy môn này dày cả nửa gang tay th́ với tuổi đời 
hơn 
sáu bó, trí cùn năo rỗng th́ làm sao mà hấp thụ đươc. Nhờ thầy bạn dạy th́ những 
người có khả năng về ngành nghề nầy luôn luôn bận bịu với công việc hàng ngày. 
Thường thường họ rời sở làm không trước 8, 9 giờ tối. Ngày thứ bảy hay chúa nhật 
họ cũng bận luôn. Tôi ngỡ rằng dự án nầy có lẽ sẽ không bao giờ có thể ra đời 
đươc. Chán nản và hầu như muốn bỏ cuộc, th́ nhân chuyến anh Hà Huyền Chi ghé 
thăm tôi đă rất hứng khởi khi nghe đến công việc sưu tập và điện 
toán hóa Ca Dao 
và Tục Ngữ, anh không ngừng nhắc nhở và khuyến khích tôi 
phải tiếp tục cho đến khi 
hoàn tất. Nhờ những cú điện thoại viễn liên khuyến khích của anh mà tôi lôi lại đống 
tài liệu và Database trong kệ sách ra xem lại th́ một vấn nạn khác xảy ra là 
DATA trong database bị crossed link/hỏng mất hơn một nửa .  Sau sáu tháng sửa chữa và bổ túc lại database Ca Dao tôi đă truy cập khoảng 3 
phần  4 của database cũ và sẵn sàng đưa lên NET tuy nhiên cái mô kỹ thuật 
vẫn c̣n chận bước tiến của tôi lai. Một dịp 
may đă đến là trong lúc post bài hát của chị Hoàng Vân lên 
mạng lưới  Tam Hà, tôi được biết chị có vơ 
công Database trên Net rất 
cao. Thế là tôi bèn thỉnh chị ấy xuống núi giúp đỡ. Đúng là trời không phụ hảo 
tâm nhân, chị ấy bằng ḷng viết script cho dự án. Chị đă trắc nghiệm ngay trên trang nhà
http://www.Vannha.com của chị và Database 
chạy ngon lành. Chị báo cho tôi biết tôi bèn hăng hái nhảy lên NET làm thử. Sau 
khi thử t́m với thí dụ: "tương thối" th́ không có kết kết quả. Tôi thử kiếm với 
chữ "Anh" (chữ không có dấu) th́ vô số câu ca 
dao nào có chữ "anh" xuất hiện trên màn ảnh. Nhưng 
rồi một vấn đề 
khác xẩy ra làm chúng tôi điên đầu. Những chữ xuất hiên trên màn ảnh chỉ toàn là 
rơm rác không đọc được. Tôi báo cho chị Hoàng Vân biết 
điểm khó khăn. Chị Hoàng Vân đă sửa chữa được 
ngay. Nguyên tôi dùng Unicode UTF-8. Ngay lúc đó chị dùng Unicode NCR &#UTF-8  để thay thế cho UTF-8 th́ kết quả như ư muốn. 
Khốn nỗi muốn có database với dạng Unicode NCR  th́ tôi không làm sao 
chuyển cả chục ngh́n câu có dạng mă Unicode UTF-8 ra Unicode NCR không lẽ bây 
giờ lại ngồi đánh lại từng câu từng chữ 
thẳng lên trên web. Rốt cụộc chị Hoàng Vân và tôi đă t́m ra 
chân lư là dùng VietUni Program của anh Tuấn Trần bên Đức để chuyển mă từng phần 
Database. Khó khăn cũng chưa hẳn đă hết. Đó là sự tiện dụng khi đánh dạng mă Unicode 
vào ô "T́m Ca Dao" cho người sử dụng. Để giải 
quyết vấn đề nầy anh Kenny Đỗ đă đưa Java Script của VietUni 
của anh Tuấn Trần (http://www.avys.de/js/src/vietuni.html) vào Search Engine đă giải 
quyết ngay tức khắc vấn đề tiện dụng cho người truy t́m ca dao trong database. Một khó khăn cuối cùng mà chúng tôi gặp phải là khi truy t́m các chữ 
ươ có dấu hay không đều không thể t́m đươc. Cuối cùng 
nhờ sự giúp đỡ của http://www.Vovisoft.com 
giúp đỡ bằng các thêm một hàng "Meta content" có điều kiện "charset=windows-1252" 
để bắt buộc browser chỉ cho phép sử dụng Unicode NCR trong trang web. Tôi viết lại những ḍng này như một bày tỏ ḷng cám ơn đến những hảo bằng hữu 
đă khuyến khích, giúp đỡ tôi thực hiện được chủ đích là góp phần ḿnh cho văn 
hoá Việt Nam. Và cũng là để chia sẻ với bạn đọc.
 Trân trọng, HPH
 
 Bổ Túc ngày 7 tháng 4 năm 2004 Tưởng rằng database (Cadao) đă yên nhưng khi bổ sung ca dao mới, chúng tôi 
thấy nhiều ca dao chúng tôi đă vào rồi sao lại biến mất trong database. Chúng 
tôi lại phải lôi xuống đem ra so sánnh  th́ khám phá đầu tiên là chữ  
Đ khi chuyển ra Unicode NCR th́ tùy dạng chữ đôi khi ta thấy Đ đổi ra thành 
"Đ" đôi khi vẫn giữ nguy^n dạng chữ "Đ" v́ lẽ đó search engine áp dụng cho 
"charset=windows-1252" không thấy chữ "Đ" mà chỉ thấy "Đ". Chúng tôi đă phải 
sửa hết những sai lầm đó     |