Bài tham khảo về Web Course

14 586 1
Bài tham khảo về Web Course

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài tham khảo về Web Course

BÀI THAM KHẢO Lập trình ASP với Unicode Khoa CNTT - ĐHKHTN Bài Nội dung Các khái niệm biểu diễn ký tự máy tính Lập trình Web với tiếng việt Unicode Hỗ trợ Unicode phần mềm Tổng kết Khoa CNTT - ĐHKHTN Bài 2 Các khái niệm (1) Điểm mã – code point: ký tự gán số nguyên không âm Đơn vị mã – code unit: đơn vị nhớ lưu trữ điểm mã (8, 16, 32,…) Bảng mã – code page: tập hợp điểm mã tập ký tự, gọi trang mã, bảng mã, mã Khoa CNTT - ĐHKHTN Bài Các khái niệm(2) VD Bảng mã ASCII Tập ký tự : 0-31 : ký tự điều khiển, 32-127: ký tự ASCII (chữ, số, …) Điểm mã: – 127 ứng với ký tự Đơn vị mã: byte (8 bit) Mỗi điểm mã mã hóa đơn vị mã Khoa CNTT - ĐHKHTN Bài Các khái niệm(3) Bảng mã ASCII mở rộng (128-255) mã hóa cho ngơn ngữ khác Code Page 1250 1252 1258 … Upper 128 Eastern Europe West Euro Ansi Vietnamese … Lower 128 ASCII ASCII ASCII … Khoa CNTT - ĐHKHTN Bài Các khái niệm(3) Biểu diễn Tiếng Việt tổ hợp - decomposed (trong bảng mã Vietnamese 1258) Các từ có dấu tổ hợp từ CHỮ CÁI + THANH Ví dụ : ế = ê + ́ Biểu diễn Tiếng Việt dựng sẵn -precomposed Mỗi ký tự tiếng việt “ế” biểu diễn điểm mã (TCVN3-ABC dùng 134 điểm mã) Khoa CNTT - ĐHKHTN Bài Các khái niệm(4) Bảng mã Unicode Thống ngôn ngữ bảng mã Trên tài liệu biểu diễn nhiều ngôn ngữ khác Các vấn đề Tập ký tự Unicode biểu diễn Cách mã hóa điểm mã, đơn vị mã Khoa CNTT - ĐHKHTN Bài Các khái niệm(5) Cách tổ chức ⇒ Mỗi điểm mã biểu diễn đơn vị mã 16 bit Số lượng điểm mã : 65536 (0 – 65535) Là phiên Unicode nguyên thủy : UCS-2 Các biến đổi Unicode – UTF Cách biểu diễn điểm mã theo đơn vị mã khác UTF-8 : 1-4 đơn vị mã bit UTF-16: 1-2 đơn vị mã 16 bit Khoa CNTT - ĐHKHTN Bài Các khái niệm(6) Cách tổ chức UTF-8 128 kí tự từ điểm mã U+0000 đến U+007F, mã hóa thành byte Từ điểm mã U+0080 đến U+07FF, mã hóa thành byte Từ điểm mã U+0800 đến U+FFFF, mã hóa thành byte Từ điểm mã U+0800 đến U+FFFF, mã hóa thành byte => Khi lập trình phải xác định rõ Unicode UCS-2, UTF-8, UTF-16,… Khoa CNTT - ĐHKHTN Bài Lập trình web Tiếng Việt với Unicode(1) Chỉ định bảng mã trang Web Sử dụng số tham chiếu ký tự NCR Cách biểu diễn : å å VD: bảng mã windows-1252 “Tiếng Việt” -> Tiếng Việt Khoa CNTT - ĐHKHTN Bài 10 Lập trình web Tiếng Việt với Unicode(2) Hoạt động WebServer Trả liệu Client : Yêu cầu webserver mã hóa liệu chuyển theo bảng mã // Dùng cho toàn trang Session hành // Dùng cho trang hành Khoa CNTT - ĐHKHTN Bài 11 Lập trình web Tiếng Việt với Unicode(3) Các bước thực lập trình ASP Soạn lưu trữ tập tin asp mã hóa UTF-8 Chỉ định bảng mã cho server xử lý đầu trang ASP Khoa CNTT - ĐHKHTN Bài 12 Lập trình web Tiếng Việt với Unicode(4) Các bước thực lập trình ASP Sử dụng HQT CSDL có hỗ trợ Unicode SQL Server 7/2000, Ms Access 2000,… Lưu ý sử dụng SQL Server 7/2000 Kiểu liệu Unicode : NCHAR, NVARCHAR, NTEXT,… Khi sử dụng chuỗi thêm N” … “ N”Chuỗi Unicode” Khoa CNTT - ĐHKHTN Bài 13 Các phần mềm hỗ trợ Unicode Soạn thảo : Notepad, FrontPage 2002, Visual Studio.Net, DreamWeaver MX 2004,… Phần mềm gõ tiếng Việt : Unikey, Vietkey,… IIS 5.0 đọc tập tin lưu dạng UCS-2, không hỗ trợ CodePage bảng mã UTF-16 1200 IIS 4.0 không hỗ trợ CodePage bảng mã UTF-8 65001 Khoa CNTT - ĐHKHTN Bài 14 ... xác định rõ Unicode UCS-2, UTF-8, UTF-16,… Khoa CNTT - ĐHKHTN Bài Lập trình web Tiếng Việt với Unicode(1) Chỉ định bảng mã trang Web ... CHARSET=UTF-8"> Sử dụng số tham chiếu ký tự NCR Cách biểu diễn : å å VD: bảng mã windows-1252 “Tiếng Việt” -> Tiếng Việt Khoa CNTT - ĐHKHTN Bài 10 Lập trình web Tiếng Việt với Unicode(2)...Nội dung Các khái niệm biểu diễn ký tự máy tính Lập trình Web với tiếng việt Unicode Hỗ trợ Unicode phần mềm Tổng kết Khoa CNTT - ĐHKHTN Bài 2 Các khái niệm (1) Điểm mã – code point: ký tự gán

Ngày đăng: 22/08/2012, 10:37

Hình ảnh liên quan

„ Bảng mã – code page: tập hợp những điểm mã của một tập ký tự, gọi là trang mã, bảng  mã, bộmã. - Bài tham khảo về Web Course

Bảng m.

ã – code page: tập hợp những điểm mã của một tập ký tự, gọi là trang mã, bảng mã, bộmã Xem tại trang 3 của tài liệu.
„ VD Bảng mã ASCII - Bài tham khảo về Web Course

Bảng m.

ã ASCII Xem tại trang 4 của tài liệu.
„ Bảng mã ASCII mở rộng (128-255) mã hóa cho các ngôn ngữkhác - Bài tham khảo về Web Course

Bảng m.

ã ASCII mở rộng (128-255) mã hóa cho các ngôn ngữkhác Xem tại trang 5 của tài liệu.
„ Chỉ định bảng mã trong trang Web - Bài tham khảo về Web Course

h.

ỉ định bảng mã trong trang Web Xem tại trang 10 của tài liệu.
„ IIS 4.0 không hỗ trợ CodePage của bảng mã UTF-8 là 65001. - Bài tham khảo về Web Course

4.0.

không hỗ trợ CodePage của bảng mã UTF-8 là 65001 Xem tại trang 14 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan