• Bỏ qua primary navigation
  • Skip to main content
  • Bỏ qua primary sidebar
  • Bỏ qua footer

ngonngu.net

Ngôn ngữ học và Tiếng Việt

  • Ngôn ngữ học
    • Các vấn đề chung
      • Đại cương
      • Đối chiếu
      • So sánh lịch sử
    • Từ vựng
    • Ngữ âm
      • Ngữ âm học
      • Âm vị học
      • Chữ viết
    • Ngữ pháp
    • Ngữ nghĩa học
    • Ngữ dụng học
    • Ngôn ngữ học xã hội
    • Khuynh hướng
  • Tiếng Việt
    • Lịch sử
    • Phương ngữ
    • Hiện tại
  • Chuyên đề
    • Tiếng Việt & CNTT
    • Tài liệu tham khảo
    • Thông tin tổng hợp
  • Ngày này năm xưa
  • Dự án S
  • Liên hệ & Hỗ trợ
Bạn đang ở:Trang chủ / Chuyên đề / Tiếng Việt & CNTT / Khử dấu phụ bằng `sed’

Khử dấu phụ bằng `sed’

26/06/2006

ngonngu.net
26/06/2006Chuyên mục:
  • Tiếng Việt & CNTT

Nhiều lúc bạn cần gửi một email nào đó và sợ người nhận không đọc được tiếng Việt có dấu. Sẽ rất mất thời gian nếu bạn phải ngồi… gõ thêm một bản không có dấu.

Trong Windows, bạn có thể sử dụng công cụ chuyển mã của Unikey để làm việc này chỉ với vài tổ hợp phím tắt. Nhưng trong Linux, uvconv lại chưa thấy có tuỳ chọn này. Tuy nhiên, chúng ta có thể dùng `sed' với lệnh sau:

$ sed -e ‘s/[àảãáạằẳẵắặăầẩẫấậâ]/a/g’ \

-e ‘s/[èẻẽéẹềểễếệê]/e/g’ \

-e ‘s/[ìỉĩíị]/i/g’ \

-e ‘s/[òỏõóọồổỗốộôờởỡớợơ]/o/g’ \

-e ‘s/[ùủũúụừửữứựư]/u/g’ \

-e ‘s/[ỳỷỹýỵ]/y/g’ \

-e ‘s/đ/d/g’ \

-e ‘s/[ÀẢÃÁẠẰẲẴẮẶĂẦẨẪẤẬÂ]/A/g’ \

-e ‘s/[ÈẺẼÉẸỀỂỄẾỆÊ]/E/g’ \

-e ‘s/[ÌỈĨÍỊ]/I/g’ \

-e ‘s/[ÒỎÕÓỌỒỔỖỐỘÔỜỞỠỚỢƠ]/O/g’ \

-e ‘s/[ÙỦŨÚỤỪỬỮỨỰƯ]/U/g’ \

-e ‘s/[ỲỶỸÝỴ]/Y/g’ \

-e ‘s/Đ/D/g’ CODAU > KHONGDAU

Giải thích:

Lệnh trên sẽ mở tập tin CODAU (có dấu), chuyển các kí tự có dấu thành không dấu và xuất kết quả ra tập tin KHONGDAU (không dấu).

Tuy nhiên, vẫn thật là bất tiện nếu như lần nào bạn cũng phải gõ chính xác từng đó kí tự. Có một cách đơn giản là viết một đoạn mã shell có lệnh trên. Bạn tạo tập tin khudau.sh với nội dung như sau:

#!/bin/sh

 

sed -e ‘s/[àảãáạằẳẵắặăầẩẫấậâ]/a/g’ \

-e ‘s/[èẻẽéẹềểễếệê]/e/g’ \

-e ‘s/[ìỉĩíị]/i/g’ \

-e ‘s/[òỏõóọồổỗốộôờởỡớợơ]/o/g’ \

-e ‘s/[ùủũúụừửữứựư]/u/g’ \

-e ‘s/[ỳỷỹýỵ]/y/g’ \

-e ‘s/đ/d/g’ \

-e ‘s/[ÀẢÃÁẠẰẲẴẮẶĂẦẨẪẤẬÂ]/A/g’ \

-e ‘s/[ÈẺẼÉẸỀỂỄẾỆÊ]/E/g’ \

-e ‘s/[ÌỈĨÍỊ]/I/g’ \

-e ‘s/[ÒỎÕÓỌỒỔỖỐỘÔỜỞỠỚỢƠ]/O/g’ \

-e ‘s/[ÙỦŨÚỤỪỬỮỨỰƯ]/U/g’ \

-e ‘s/[ỲỶỸÝỴ]/Y/g’ \

-e ‘s/Đ/D/g’ ~/CODAU > ~/KHONGDAU

Bạn chmod +x cho tập tin khudau.sh và chép nó vào thư mục ~/.

Mỗi lần cần khử dấu một văn bản nào đó, bạn chỉ cần mở tập tin ~/CODAU (nếu chưa có tập tin này thì tạo nó trước bằng lệnh touch ~/CODAU), chép đè nội dung cần khử dấu và lưu lại. Sau đó chạy ~/khudau.sh. Và cuối cùng là mở tập tin kết quả ~/KHONGDAU ra…

Đây mới chỉ là một ý tưởng và thực tế thì việc sử dụng cũng hơi mất thời gian. Hi vọng ai đó, nếu biết lập trình, có thể viết một chương trình dễ dùng hơn, tương tự công cụ của Unikey trên Windows ;).

Chia sẻ:

  • Click to share on Facebook (Opens in new window)
  • Click to share on Twitter (Opens in new window)
  • Click to share on WhatsApp (Opens in new window)
  • Click to share on LinkedIn (Opens in new window)

Điều hướng bài viết

Bài trước Quan điểm của ngonngu.net đối với một số vấn đề về chính tả
Bài tiếp theo Phụ tố tiếng Anh và vấn đề dịch thuật ngữ tin học từ tiếng Anh sang tiếng Việt (Phần 1)

Sidebar chính

Mục lục

  • Ngôn ngữ học
    • Các vấn đề chung
      • Đại cương
      • Đối chiếu
      • So sánh lịch sử
    • Từ vựng
    • Ngữ âm
      • Ngữ âm học
      • Âm vị học
      • Chữ viết
    • Ngữ pháp
    • Ngữ nghĩa học
    • Ngữ dụng học
    • Ngôn ngữ học xã hội
    • Khuynh hướng
  • Tiếng Việt
    • Lịch sử
    • Phương ngữ
    • Hiện tại
  • Chuyên đề
    • Tiếng Việt & CNTT
    • Tài liệu tham khảo
    • Thông tin tổng hợp
  • Ngày này năm xưa
  • Dự án S
  • Liên hệ & Hỗ trợ

Footer

Đăng kí theo dõi

Nhập địa chỉ email của bạn để nhận thông báo khi có bài mới.

Liên kết

  • Nhóm Facebook
  • Dự án S – Công cụ tiếng Việt
  • Paratime Studio

Tìm kiếm

Liên hệ và Hỗ trợ

  • Giới thiệu
  • Liên hệ

© 2023 ngonngu.net