Tiến Trình Thực Hiện>

Home

Tìm Ca Dao

Trợ Giúp Tìm Ca Dao

Trang Chủ

Toàn Bộ Danh Mục

English

Thư Mục

Lời Phi Lộ

Lời Giới Thiệu

Cách Sử Dụng

Dẫn Giải

Diêu Dụng

Cảm Nghĩ

Ẩm Thực

Chợ Quê

Cội Nguồn

Cổ Tích

Lễ Hội

Lịch Sử

Ngôn Ngữ

Nhân Vật Nữ

Nhạc Cụ Việt Nam

Phong Tục Tập Quán

Quê Ta

Tiền Tệ Việt Nam

Tiểu Luận

Văn Minh Cổ

Vui Ca Dao

Trang Nhạc Dân Ca

Trang Chủ

Tìm Bài Trong
Toàn Trang
Ca Dao Tục Ngữ bằng:

Tiến Trình Thực Hiện Bộ Tự Điển Điện Toán Ca Dao

Trong nỗ lực mong đóng góp một chút tài mọn để bảo tồn Văn Hóa Việt mà Văn Chương Bình Dân giữ một vai trò tối ư quan trọng, cho nên trong bốn năm liền, tôi đã cố gắng góp nhặt ca dao, tục ngữ, thành ngữ, dân ca v.v. từ sách báo cũng như truyện rồi đưa vào Access Database để chờ ngày đưa lên Mạng Lưới Toàn Cầu hầu làm một phương tiện tra cứu hữu hiệu cho mọi giới. Làm xong Database thì tôi vấp phải trở ngại lớn lao là kỹ thuật đưa lên NET cũng như tìm một dạng mã phổ thông để ai ai cũng có thể đọc đươc. Muốn thực hiện được dự án nầy tôi phải tầm sư học chưởng pháp ASP, một ứng dụng (application) để ta có thể truy lục dữ kiện tàng chứa trong Database từ một Server nào đó.

Học ASP quá khó vì các sách dạy môn này dày cả nửa gang tay thì với tuổi đời hơn sáu bó, trí cùn não rỗng thì làm sao mà hấp thụ đươc. Nhờ thầy bạn dạy thì những người có khả năng về ngành nghề nầy luôn luôn bận bịu với công việc hàng ngày. Thường thường họ rời sở làm không trước 8, 9 giờ tối. Ngày thứ bảy hay chúa nhật họ cũng bận luôn. Tôi ngỡ rằng dự án nầy có lẽ sẽ không bao giờ có thể ra đời đươc. Chán nản và hầu như muốn bỏ cuộc, thì nhân chuyến anh Hà Huyền Chi ghé thăm tôi đã rất hứng khởi khi nghe đến công việc sưu tập và điện toán hóa Ca Dao và Tục Ngữ, anh không ngừng nhắc nhở và khuyến khích tôi phải tiếp tục cho đến khi hoàn tất.

Nhờ những cú điện thoại viễn liên khuyến khích của anh mà tôi lôi lại đống tài liệu và Database trong kệ sách ra xem lại thì một vấn nạn khác xảy ra là DATA trong database bị crossed link/hỏng mất hơn một nửa .

Sau sáu tháng sửa chữa và bổ túc lại database Ca Dao tôi đã truy cập khoảng 3 phần 4 của database cũ và sẵn sàng đưa lên NET tuy nhiên cái mô kỹ thuật vẫn còn chận bước tiến của tôi lai. Một dịp may đã đến là trong lúc post bài hát của chị Hoàng Vân lên mạng lưới Tam Hà, tôi được biết chị có võ công Database trên Net rất cao. Thế là tôi bèn thỉnh chị ấy xuống núi giúp đỡ. Đúng là trời không phụ hảo tâm nhân, chị ấy bằng lòng viết script cho dự án. Chị đã trắc nghiệm ngay trên trang nhà http://www.Vannha.com của chị và Database chạy ngon lành. Chị báo cho tôi biết tôi bèn hăng hái nhảy lên NET làm thử. Sau khi thử tìm với thí dụ: "tương thối" thì không có kết kết quả. Tôi thử kiếm với chữ "Anh" (chữ không có dấu) thì vô số câu ca dao nào có chữ "anh" xuất hiện trên màn ảnh. Nhưng rồi một vấn đề khác xẩy ra làm chúng tôi điên đầu. Những chữ xuất hiên trên màn ảnh chỉ toàn là rơm rác không đọc được. Tôi báo cho chị Hoàng Vân biết điểm khó khăn. Chị Hoàng Vân đã sửa chữa được ngay. Nguyên tôi dùng Unicode UTF-8. Ngay lúc đó chị dùng Unicode NCR &#UTF-8 để thay thế cho UTF-8 thì kết quả như ý muốn. Khốn nỗi muốn có database với dạng Unicode NCR thì tôi không làm sao chuyển cả chục nghìn câu có dạng mã Unicode UTF-8 ra Unicode NCR không lẽ bây giờ lại ngồi đánh lại từng câu từng chữ thẳng lên trên web. Rốt cụộc chị Hoàng Vân và tôi đã tìm ra chân lý là dùng VietUni Program của anh Tuấn Trần bên Đức để chuyển mã từng phần Database.

Khó khăn cũng chưa hẳn đã hết. Đó là sự tiện dụng khi đánh dạng mã Unicode vào ô "Tìm Ca Dao" cho người sử dụng. Để giải quyết vấn đề nầy anh Kenny Đỗ đã đưa Java Script của VietUni của anh Tuấn Trần (http://www.avys.de/js/src/vietuni.html) vào Search Engine đã giải quyết ngay tức khắc vấn đề tiện dụng cho người truy tìm ca dao trong database.

Một khó khăn cuối cùng mà chúng tôi gặp phải là khi truy tìm các chữ ươ có dấu hay không đều không thể tìm đươc. Cuối cùng nhờ sự giúp đỡ của http://www.Vovisoft.com giúp đỡ bằng các thêm một hàng "Meta content" có điều kiện "charset=windows-1252" để bắt buộc browser chỉ cho phép sử dụng Unicode NCR trong trang web.

Tôi viết lại những dòng này như một bày tỏ lòng cám ơn đến những hảo bằng hữu đã khuyến khích, giúp đỡ tôi thực hiện được chủ đích là góp phần mình cho văn hoá Việt Nam. Và cũng là để chia sẻ với bạn đọc.

Trân trọng, HPH

Bổ Túc ngày 7 tháng 4 năm 2004

Tưởng rằng database (Cadao) đã yên nhưng khi bổ sung ca dao mới, chúng tôi thấy nhiều ca dao chúng tôi đã vào rồi sao lại biến mất trong database. Chúng tôi lại phải lôi xuống đem ra so sánnh thì khám phá đầu tiên là chữ Đ khi chuyển ra Unicode NCR thì tùy dạng chữ đôi khi ta thấy Đ đổi ra thành "Đ" đôi khi vẫn giữ nguy^n dạng chữ "Đ" vì lẽ đó search engine áp dụng cho "charset=windows-1252" không thấy chữ "Đ" mà chỉ thấy "Đ". Chúng tôi đã phải sửa hết những sai lầm đó


Sưu Tầm Tài Liệu và Web Design		Hà Phương Hoài
Kỹ Thuật Truy Tầm		Hoàng Vân
Sưu tầm Nhạc Dân Ca		Julia Nguyễn

Xin vui lòng liên lạc với haphuonghoai@gmail.com về tất cả những gì liên quan đến trang web nầy Copyright © 2003 Trang Ca Dao và Tục Ngữ Last modified: 03/14/19

Xin vui lòng liên lạc với haphuonghoai@gmail.com về tất cả những gì liên quan đến trang web nầy
Copyright © 2003 Trang Ca Dao và Tục Ngữ
Last modified: 03/14/19