Âm thanh lời nói là một hiện tượng tự nhiên bao gồm những dao động của thực thể vật lí mà âm học hiện đại biểu thị ra bằng cao độ (nội dung của dây thanh), cường độ, trường độ…
Nhưng từ khi xuất hiện văn tự, âm thanh không còn là một dạng thể hoàn toàn tự nhiên nữa. Nó được biểu diễn ra trên kênh viết dưới hình thức văn tự ghi âm ghi âm. Đó chính là một phép chuyển kênh hay là một sự cải biến về âm thanh tự nhiên sang các kí hiệu được thụ cảm bằng thị giác (từ thính giác tới thị giác).
"Lời nói gió bay" là nhược điểm lớn nhất của âm thanh bằng lời. Lời nói muốn được lưu giữ lại cần đến sự tác động nhân tạo vào đối tượng. Vì sự lưu lại lời nói âm thanh cho con người là có ích về nhiều mặt. Vì vậy, từ khi có ngôn ngữ học, người ta luôn luôn tìm ra những giải pháp tối ưu hơn cho việc lưu lại âm thanh tự nhiên của con người. Chúng ta có những dạng sau đây:
Tự nhiên (sóng âm) | Lưu giữ (nhân tạo tính) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Âm thanh tự nhiên | Thẩm nhận qua tai: Băng/đĩa từ, đĩa quang… | |||||||||||
Thẩm nhận qua thị giác
|
Dạng ghi lời nói qua văn tự, tuỳ theo tiến bộ của khoa học kĩ thuật mà âm thanh có thể được chuyển tải, được ghi lại với mức độ chính xác khác nhau. Tuy nhiên, các điều kiện kĩ thuật của con người không thể phản ánh trung thực và khách quan những điều tế vi nhất của âm thanh con người.
Còn những sự lưu giữ thông qua kênh thị giác là hình ảnh chủ quan của con người về thế giới âm thanh. Bằng chứng là dòng âm thanh liên tục đã được cắt ra theo truyền thống chữ viết của từng dân tộc. Tuỳ theo nét thô hay nét tinh mà các chữ cái được sắp lại thành chuỗi nhằm thể hiện được tính liên tục của âm thanh trong tự nhiên:
Ví dụ: /ʈ/: "tr"
Trong hình dung của A. de Rhodes (1651), âm này được "tãi" ra thành hai yếu tố tuyến tính đi cạnh nhau và /t/ và /r/. So sánh: trời, blời, tlời… Có lẽ vào thời ấy, ở phụ âm đầu tiếng Việt còn tổ hợp phụ âm đầu như bl, tl, tr… Nhưng ở người Việt hiện đại, bất kì trong một thổ ngữ nào, phụ âm đầu này luôn là phụ âm quặt lưỡi đơn nhất, đồng chất và không mang tính hình tuyến. Tiếng Việt đã trải qua quá trình đơn tiết hoá đến triệt để, đến nỗi một âm tiết xét về mặt chiết đoạn chỉ là một tổ hợp của 3 thành phần âm thanh, mô phỏng một cách tự nhiên chu kì cấu âm của con người.
Các âm khác như /f/, /t’/, /χ/ ở trong tiếng Việt được ghi bằng "ph, th, kh" là cũng có lí do tương tự như vậy. Vào thời kì A. de Rhodes, người Việt cận đại có lẽ lúc đó phát âm các phụ âm đầu này như là những tắc bật hơi để phân biệt với các âm tắc bình thường:
*/p’/ → (/f/)
*/t’/ → (t’/)
*/k’/ → (/χ/)
Vì vậy, ông đã sử dụng chữ "h" để ghi các yếu tố bật hơi có trong tiếng Việt. Do vậy mà ở vị trí đầu này đã có tới 2 chữ cái cho một âm vị.
Văn tự là văn hoá, là thói quen ghi chữ của một cộng đồng. Gần 4 thế kỉ tồn tại của hệ chữ viết Việt Nam đã tạo thành một nét văn hoá trong chữ viết, đến mức một cá nhân dẫu có uy tín lớn như Hồ Chí Minh rất mong muốn "âm vị hoá" hoá lại hệ chữ viết này ngay từ khi Người đi tìm đường cứu nước đến khi Người viết di chúc mà ý nguyện đó vẫn chưa thực hiện được. Đó chính là tính độc lập tương đối của văn tự, là hình ảnh âm thanh quá khứ dội về. Đó là tiếng vang văn hoá và không thể ngày một, ngày ngày hai mà có thể cải tiến và sửa chữa được.
Như vậy, người ta có thể lưu giữ lời nói âm thanh tự nhiên của con người thông qua hệ chữ viết của mình, nhưng đây là một thứ biểu diễn âm vị học sơ cấp, tính khoa học nhường chỗ cho tính văn hoá và tình phổ cập. Từ khi xuất hiện cấu trúc luận, nhất là từ khi xuất hiện những tuyên ngôn của trường phái Praha về ngôn ngữ học, người ta lưu ý hơn đến việc lưu giữ hệ âm thanh tiếng nói con người thông qua kênh thị giác. Bởi vì, qua kênh thị giác, con người có thời gian suy nghĩ nhiều hơn về bản chất âm thanh tiếng nói con người, tận dụng được năng lực cảm nhận một cách tối ưu cái mà tự nhiên cấp cho con người: 90% thông tin con người nhận được là thông qua thị giác.
Nhưng từ cấu trúc luận trở đi, việc biểu diễn âm vị học không còn là một hành động tự phát của con người trong việc đòi lấy một sự bình đẳng giữa kênh nghe và kênh nhìn. Từ cấu trúc luận trở đi, người ta chia thành hai dạng biểu diễn âm vị học: một dạng mang tính ngữ âm học; một dạng mang tính âm vị học. Cả hai dạng này đều là những cố gắng tự giác của con người trước âm thanh của mình. Biểu diễn âm thanh theo lối ngữ âm học là sử dụng một bảng phiên âm thống nhất trên toàn thế giới cho việc ghi lại một dòng âm thanh thanh mà con người ta nghe được. Từ 1890, khi Hội Ngữ âm học quốc tế (International Phonetic Association – IPA) được hình thành, việc đầu tiên trong các việc họ phải làm là thiết lập một bảng chữ cái chung cho các âm có trên toàn thế giới. Bảng phiên âm này có tên: International Phonetic Alphabet (IPA). Cứ 5 năm một lần kể từ khi thành lập, những nhà ngữ âm học quốc tế lại nhóm họp để cải biên, bổ sung, sửa đổi cho bảng chữ cái này tương thích hơn với hệ âm thanh tiếng nói con người. Bảng IPA bao gồm các kí tự Latinh, kí tự Hi Lạp và một hệ các dấu phụ để phản ánh được trung thành hơn các dạng thể âm thanh của con người. Vào năm 1993, sau gần 100 năm xuất hiện IPA, các nhà ngữ âm học đã chỉnh sửa và đưa ra bảng chữ cái quốc tế cho phiên âm mà chúng ta đang dùng.
Việc sử dụng bảng IPA để phiên âm được gọi là phép phiên âm hẹp theo trường phái Mĩ, vì người phiên âm phải phiên âm một cách trung thành và chính xác dòng âm thanh mà mình tiếp nhận.
Ví dụ: "toan" = bao gồm:
[t]
[a]
[n]
là 3 âm tố chính quan trọng. Ngoài ra, khi phát âm thì [t] và [a] đều tròn môi ([to], [ao]).
Khi phát âm "toan" thì [-n] đứng ở vị trí cuối cùng của âm tiết, một vị trí không thuận lợi cho việc phân biệt giữa nét hữu thanh và vô thanh, giữa nét tắc và xát, trường độ của âm cuối vô cùng ngắn (âm cuối thường có trường độ từ 3–5ms trong tương quan với âm đầu có trường độ là từ 17–25ms), nên [-n] trong "toan" là một âm mũi nhưng không đầy đủ về tính hữu thanh và vang. Vì vậy, khi phiên âm hẹp âm cuối này thì dưới kí hiệu này còn phải ghi chú thêm tình trạng ít tính thanh (to).