Chuyển dạng tài liệu dễ dàng hơn với công nghệ số potx

24 289 0
Chuyển dạng tài liệu dễ dàng hơn với công nghệ số potx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chuyển dạng tài liệu dễ dàng hơn với công nghệ số Paul Conway - Trưởng phòng, Phòng Bảo quản, Thư viện Trường Đại học Yale Tóm tắt Bài viết này nhằm ba mục đích. Trước tiên, bài viết định nghĩa các công nghệ số dưới góc độ của truyền thông và mã hoá. Tiếp theo, bài viết trình bày những thành ph ần then chốt của một hệ thống công nghệ ảnh số (digital imaging system) và những bước quan trọng nhất trong quá trình tạo hình ảnh số. Cuối cùng, bài viết nêu ra một số vấn đề lớn cần phải l ưu ý khi các th ư viện và trung tâm lưu trữ chuyển từ quá trình thử nghiệm công nghệ số sang sử dụng nó như một công cụ để chuyển đổi cách thức hoạt động của mình. Mục lục Nh ững khái niệm cơ bản về kỹ thuật số Sản phẩm và quá trình tạo hình ảnh số Nh ững vấn đề cần lưu ý Giới thiệu Chúng ta đang sống trong một thế giới số. Kỹ thuật số hiện hữu ở mọi nơi. Số bàn phím nhiều hơn cả số nhân viên văn phòng. Ai cũng có riêng một trang Web. Không còn ai phải đem theo tiền mặt. Những từ như "bitslag", "jitterati", "NIMQ" và "CGIJoe" xuất hiện trong những câu chuyện thường ngày. Những nhà tỷ phú công nghệ dường như sở hữu những bản sao kỹ thuật số của tất cả những kho tàng nghệ thuật. Đối với các thư viện và trung tâm lưu tr ữ, lo ngại dường như càng tăng lên rằng nếu chúng ta không áp dụng kỹ thuật số, không hoà mình vào kỹ thuật số, không tư duy kỹ thuật số thì chúng ta đang tự giam mình trong một bảo tàng giấy khổng lồ. Thế nhưng, thách thức lớn nhất mà chúng ta gặp phải có lẽ không phải là đi theo công nghệ số mà phải là xây dựng một ngôn ngữ chung để mô tả những biến đổi có tác động phi thường như vậy tới cuộc sống hàng ngày của chúng ta. Một vốn từ chung là yếu tố then chốt để xây dựng một xã hội hành động và một tầm nhìn chung về tương lai giữa những người đang gánh trách nhiệm lưu giữ các nguồn lực văn hoá của đất nước. Jim Taylor và Watts Wacker chỉ ra rằng "Nếu nhìn lại lịch sử, giá trị thực sự đọng lại từ cuốn Những xu hướng lớn (Megatrends) của Naisbitt và Làn sóng thứ ba (Third Wave) của Toffler's hoá ra lại là từ ngữ chứ không phải thế giới quan". Không đâu mà từ ngữ lại đáng để bàn hơn là trong cách nhìn của chúng ta về vị trí của công tác bảo quản trong thế giới số mà chúng ta đang sống. Nh ững khái niệm cơ bản về kỹ thuật số ở mức độ cơ bản nhất, các công nghệ số là một sự tiếp nối cách thức mà từ xưa đến nay chúng ta giao tiếp với nhau. Nhu c ầu giao tiếp tạo ra động cơ và cơ s ở hợp lý cho sự phát triển của đủ loại công nghệ. Thế giới số ngày nay gắn liền với việc sáng tạo, chia sẻ và sử dụng thông tin dưới dạng số. Thông tin số hoá là những dữ liệu được cấu trúc và xử lý, lưu trữ và nối mạng, được trả tiền và được bán. Thông tin nằm ở nhiều dạng khác nhau. Một trong những cách phân biệt các dạng này là phân biệt giữa thông tin tượng hình và thông tin mã hoá. Chúng ta hãy mô tả điều này bằng cách nhìn vào rất nhiều cách biểu diễn chữ cái phổ biến nhất trong bảng chữ cái Latinh - chữ cái E - bắt đầu với những biểu tượng khai của bảng chữ cái in. Một bài học lịch sử Thời kỳ từ phát minh của Guntenberg vào gi ữa thế kỷ 15 cho đến năm 1500 thường được gọi là kỳ. Vào thời kỳ này, các nhà in và nhà làm sách phải tốn khá nhiều công sức để làm cho sản phẩm của mình - từ kiểu chữ, định dạng đến trình bày - có bề ngoài và cách sử dụng giống như những cuốn sách viết tay của những thế kỷ trước. Chỉ đến khi lý thuyết về bảng chữ cái và lý thuyết về sách xuất hiện vào khoảng thời kỳ mà tác phẩm cổ điển của Geofroy Tory được thể hiện trên cấu trúc bảng chữ cái Latinh, những nhà làm sách mới có thể bắt đầu tận dụng được phát kiến công nghệ của Gutenberg. Sơ đồ 1 là minh hoạ của chữ hoa "E" trong tác phẩm Champ Leury của Tory năm 1529 được viết nhằm phát triển lý thuyết về bảng chữ cái trên cơ sở các bộ phận của cơ thể người và những nguyên lý cơ bản của Ơ-clit (Euclid). ở đây, chữ cái "E" là một mẫu vẽ bằng mực trên giấy. Thế giới được định hình bằng các chuỗi số 1 và số 0 vốn tồn tại đã từ rất lâu. ý tưởng về máy tính số bắt nguồn từ hơn 300 trước đây trong bộ óc đầy sáng tạo của nhà toán học người Đức Gottfried Wilhelm von Leibnitz. Năm 1679, Leibnitz tưởng tượng ra một thiết bị mà trong đó các con số nhị phân được thể hiện bằng những hạt nhỏ hình cầu, tuần hoàn trong một cỗ máy như kiểu máy trong trò chơi b ắn đạn, được điều khiển bởi một dạng khai của phiếu đục lỗ. Ông mô tả một hệ thống số hoàn chỉnh mà trong đó tất cả các phép tính đều có thể biểu diễn bằng những tập hợp của số 1 và số 0 - cách tiếp cận giống hệt cách mà các công nghệ số ngày nay đang sử dụng. Chúng ta đang sống trong kỷ nguyên khai của kỹ thuật số - thời kỳ được đánh dấu bằng những nỗ lực thầm lặng nhằm làm tạo ra những sản phẩm kỹ thuật số có hình thức và tính năng giống như những sản phẩm công nghệ tương tự (analog) cùng loại. Nhưng chỉ khi nào chúng ta xây dựng được một lý thuyết về biểu diễn thông tin dạng số chúng ta mới có thể khai thác hết sáng tạo toán học của Leibnitz. Ngày nay, lý thuy ết đó đang được hình thành. Sơ đồ 2 là một mẫu chữ tượng hình khác - ch ữ Braille. ở đây chữ cái "e" được biểu diễn bằng những dấu chấm nổi to và nhỏ theo những đường kẻ có thể cảm nhận được. Cũng cần lưu ý rằng cùng một mẫu chữ có thể được hiểu hoặc là chữ "E" hoặc là số "5" tuỳ thuộc ngữ cảnh của mẫu chữ đó được sử dụng. Ngữ cảnh cũng là ý tưởng rất quan trọng đối với việc biểu diễn thông tin dưới dạng số. Đối với chữ Braille, nếu bạn biết ngữ cảnh và hiểu được mẫu chữ, việc giao tiếp sẽ nhanh chóng và hiệu quả. Ngôn ng ữ Ký hiệu của Mỹ sử dụng dấu hiệu làm biểu tư ợng. Đó là ngôn ngữ mà người ta kết hợp hình dáng và c ử chỉ của bàn tay để truyền đạt ý nghĩa. Hình dáng mà không có c ử chỉ mới chỉ là một nửa của quá trình (truyền tin). Giao tiếp phụ thuộc vào việc cùng hiểu ý nghĩa của cả hai thành phần đó của ngôn ngữ. đồ 3 là sự thể hiện dưới dạng tĩnh của chữ cái "E". Tuy nhiên, trong hiệu lệnh bằng cờ, cách thức cử động lại chính là biểu tượng. Việc chuyển đổi từ một sự kết hợp giữa cờ và tay sang một sự kết hợp khác tạo ra một sự liên kết thông tin. đồ 4 là một hình thức biểu diễn khác dư ới dạng tĩnh của chữ cái "E". Những lý thuyết về truyền thông kỹ thuật số đang hình thành vẫn chưa giải thích đầy đủ về những giác quan khác nhau mà chúng ta thường sử dụng để giao tiếp trực tiếp - đó là những đặc điểm tinh tế của ngôn ngữ hành động, cử chỉ và giọng điệu. Và khi truy ền thông kỹ thuật số càng trở nên tinh vi, sự phụ thuộc của nó vào máy móc là một trở ngại lớn. Mặc dù vậy, một số hình thức đầu tiên của truyền thông trực tiếp hiện đại qua những khoảng cách lớn lại mang đặc trưng của kỹ thuật số. đồ 5 là một ví dụ về Máy điện báo bằng hình ảnh của George Murray từng truyền tin từ Luân Đôn tới Deal bắt đầu từ năm 1794. Hệ thống này bao gồm các bục nổi được đặt đối xứng ngang nhau. Trên mỗi bục nổi này có một bảng lớn gồm sáu lỗ vòng tròn l ớn có thể đóng bằng các các cửa sập bằng gỗ - khá là giống với các kiểu chữ Braille - do một nhân viên đã qua đào tạo điều khiển. Các báo cáo cho th ấy một thông điệp có thể truyền dọc một chuỗi 15 trạm trong vòng vài phút. Nhưng hãy thử tưởng tượng xem cần tổng số bao nhiêu nhân viên hành chính để vận hành hệ thống như vậy! Con đường phát triển từ Điện báo Hình ảnh tới truyền thông kỹ thuật số hiện đại được đánh dấu bằng những chuyển đổi liên tiếp từ biểu tượng sang mã số. Samuel F.B. Morse phát minh ra mã số gồm các dấu chấm và gạch ngang làm ngôn ngữ cho máy điện báo của ông. Radio - hay điện báo không dây - cũng bắt nguồn từ mong muốn mở rộng truyền thông kỹ thuật số của Morse tới những nơi mà đường dây không thể với tới được. ứng dụng đầu tiên của công nghệ tương tự sử dụng các sóng liên tục là việc truyền các dấu chấm và gạch ngang của tín hiệu Morse tới các tàu trên biển. Việc m ã hoá chữ cái E bằng mã 01100101 trong bảng mã ASCII hiện nay bắt nguồn từ các lý thuyết của Leibnitz và công nghệ thực tiễn của Samuel Morse hơn là bắt nguồn từ công nghệ phát thanh và truyền hình. Mã hoá bằng số - một số khái niệm cơ bản Hệ thống kỹ thuật số (digital) sử dụng các con số để biểu diễn một đối tượng cụ thể hoặc một ý tưởng trừu tượng. Số hoá (digitization) là quá trình chuyển đối tượng hoặc ý tư ởng đó thành một mã số. Giới hạn của công nghệ kỹ thuật số là hệ thống mã hoá chỉ sử dụng hai con số - số 1 và số 0 - vì vậy mà ta có khái ni ệm nhị phân (binary). Mỗi vị trí số trong hệ thống là một bit. Trong thế giới số bit là vật chất; chúng chiếm không gian; chúng cần thời gian để di chuyển từ vị trí này sang vị trí khác. Người ta có thể đếm và mô tả được một tập hợp các bit, giống bất cứ một thứ nào khác. Cách phổ biến nhất để đếm các bit trong một hệ thống là sử dụng "byte" hay tám bit, mặc dù công nghệ máy tính đã không còn sử dụng byte như là một đối tượng độc lập từ hàng thập kỷ trước đây. - Kỹ thuật số (digital): sử dụng các con số để thể hiện các đối tượng khác nhau - Phân tích dữ liệu số (digitalize): xử lý tín hiệu điện tim, một cách điều trị bệnh tim - Số hoá (digital): chuyển một đơn vị đo lường tỷ biến sang một mô tả dưới dạng số - Nhị phân (binaray): một hệ thống số trong đó mỗi con số được biểu diễn bằng luỹ thừa của 2 chỉ sử dụng hai con số là 0 và 1. - Bit: con số nhị phân - Byte: 8 bit Một ảnh ánh xạ bit là một bức ảnh số được tạo bởi các dòng liên tục của các bit trong một khung lư ới. Trong một bức ảnh số, một bit thường được coi là m ột điểm sáng (pixel), viết tắt của cụm từ "picture element". Giống như các đối tượng, các ảnh số được mô tả thông qua ba đặc trưng: độ phân giải, khoảng động và kích thước điểm sáng. Thời gian gần đây, khái niệm thứ tư, giá trị tín tông màu (tonal value), được áp dụng để mô tả đặc trưng c ủa một "ảnh số", một thuật ngữ gây nhầm lẫn về sự thể hiện dư ới dạng số của một bức ảnh, ví dụ như ảnh chụp. Một ảnh ánh xạ bit là một kiểu trình bày mã hoá dạng số chứ không phải là một biểu tượng được mã hoá dạng số như là chữ cái mà chúng ta có thể nhận ra qua một bảng chữ cái. - Độ phân giải (resolution): số điểm sáng (cả chiều ngang và chiều dọc) làm nên một bức ảnh - Khoảng động (dynamic range): số màu hoặc hoặc sắc thái đậm nhạt có thể có trong một bức ảnh cụ thể - Kích thước điểm sáng (pixel size): phần của lư ới điểm sáng mà một máy quét (scanner) có thể nhận biết và mã hoá được. - Tông màu (tone): mức độ mà một bức ảnh chuyển tải các khoảng độ chói của một cảnh gốc. Độ phân giải là số điểm sáng (hay số chấm) đư ợc sử dụng để mã hoá một đoạn 2,54 cm (1 inch) theo chiều ngang và/hoặc chiều đứng. Hãy quan sát một mẩu giấy kẻ dùng để vẽ biểu đồ. Số các khối nhỏ trong một inch liên tiếp hướng lên hoặc xuống của tờ giấy chính là độ phân giải. Số điểm sáng trong một đoạn nhỏ càng nhiều thì độ phân giải càng lớn và các kiểu hình ảnh hiển thị càng chính xác hơn trên một bề mặt nào đó có thể biểu diễn được dưới dạng số. Mô tả một bức ảnh bằng 300 điểm chấm trên một inch (dots per inch - dpi) nghĩa là 300 điểm sáng được sử dụng để thể hiện mỗi inch chạy ngang trên bề mặt. Đôi khi người ta (nhầm lẫn) cho rằng một bức ảnh có 300 điểm sáng theo chiều ngang cũng sẽ được biểu diễn bởi 300 dòng theo chiều đứng. Cấu trúc thực tế của một khung lưới số phụ thuộc vào năng lực của thiết bị quét hình. Sơ đồ 6 là một chữ cái e cao 3 mm ở độ phân giải 600 dpi được quét từ vi phim âm bản tại Thư viện Đại học Yale. L ưu ý r ằng mẫu chữ mã hoá bằng số chiếm khoảng 4900 bit trong máy tính so với 8 bit cần để dùng cho các biểu tượng mã hoá bằng của bảng mã ASCII. Khoảng động chỉ số lượng mầu hoặc các sắc thái đậm nhạt (shades of gray) có thể có trong một bức ảnh cụ thể. Khoảng động đôi khi còn được gọi là "độ sâu" và thường được thể hiện bằng số bit trên một điểm sáng. Trong chế độ quét ảnh lưỡng sắc, số màu sắc ứng với mỗi điểm sáng được làm tròn thành 0 (trắng) hoặc 1 (đen). Mỗi bit thông tin được dùng để [...]... vô số các kho tài liệu phức tạp và đa dạng thích hợp để chuyển sang dữ liệu số Các nguồn đa dạng về kích cỡ, định dạng, chất liệu và điều kiện bảo quản; các nguồn có thể chủ yếu dưới dạng chữ; tài liệu có thể có ảnh minh hoạ mà bản thân các ảnh minh hoạ này có thể rất đa dạng về tính chất Các nguồn cũng có thể có những nội dung quan trọng được in màu Không phải tất cả việc chuyển đổi dữ liệu sang dạng. .. công nghệ Các công nghệ số là một tập hợp công cụ đưa ra rất nhiều lựa chọn và rất ít giải pháp Có lẽ hợp lý hơn cả là nên phân biệt giữa các dự án công nghệ ảnh số nhằm thử nghiệm các năng lực của công nghệ (và kết quả là sự học hỏi) với những dự án làm thay đổi thực sự về chất các chiến lược quản lý thông tin của chúng ta Kiểm soát (Control) Liệu nó có phải là một từ bốn chữ cái (Ctrl)? Công nghệ số. .. lộn với chúng nếu muốn các dự án số hoá của họ có giá trị lâu dài Sau đây là năm vấn đề vượt khỏi tầm những đặc trưng của công nghệ ảnh số Công nghệ Công nghệ ảnh số là con voi hay chỉ là cái đuôi con voi? Các công ty chào bán công nghệ ảnh số thường ưa dùng thuật ngữ "giải pháp" để mô tả giá trị các sản phẩm của họ Thuật ngữ này hàm ý rằng khách hàng xác định vấn đề của mình và mua một giải pháp về công. .. việc chuyển dạng một cuốn sách, một tập bản thảo, một phim âm bản hoặc một cuộn vi phim không phức tạp và không lắt léo Các đối tượng nguồn phù hợp cho việc chuyển dạng được lựa chọn và chuẩn bị để quét; việc chuyển dạng được thực hiện thông qua công nghệ quét hình chuyển các tín hiệu ánh sáng phản chiếu thành dữ liệu số; việc truy cập dữ liệu số này được thực hiện bằng cách thể hiện các dữ liệu số đã... phẩm số Công nghệ là một trong những mắt xích yếu nhất trong toàn bộ hệ thống Công nghệ chuyển dạng giờ đây có khả năng tạo ra dữ liệu lớn hơn nhiều so với khả năng có thể hiển thị một cách hữu dụng của phần lớn các màn hình máy hính hiện nay Sơ đồ 7 là một minh hoạ dạng biểu đồ của các thành phần trong mô hình xử lý Quan trọng là cần nhận thấy rằng sự phức tạp của một hệ thống công nghệ ảnh số chỉ... việc sắp xếp các tài liệu gốc (bao gồm cả việc tiến hành các biện pháp bảo quản trước hoặc sau khi chuyển dạng) là một vấn đề hoàn toàn khác Suy cho cùng, mục đích của sản phẩm số bị chi phối bỏi các mục tiêu tiếp cận tài liệu, trong khi đó việc bảo quản các tài liệu gốc cần được quyết định dựa trên nhu cầu bảo quản những nguồn tài liệu này Những vấn đề đặt ra Tài liệu này đã nêu ra một số vấn đề những... những kỳ vọng của họ đối với chất lượng của các sản phẩm công nghệ ảnh số được tạo thành từ nhiều nguồn tài liệu khác nhau Chất lượng là giá trị mà chúng ta gia tăng thêm vào các sản phẩm ảnh công nghệ số Mặc dù vẫn còn tồn tại những vấn đề quan trọng về thước đo chất lượng, những trở ngại đối với việc đạt được chất lượng lại dường như không nằm ở chính bản thân công nghệ Đúng hơn là chi phí để tạo ra... chúng ta đang sống Lựa chọn Các kho tài liệu số của chúng ta vô dụng hay hữu dụng? Lựa chọn là yếu tố trung tâm của các ứng dụng công nghệ số; việc lựa chọn công nghệ mới chỉ là bước khởi đầu Lựa chọn nội dung cũng không kém phần quan trọng Không giống như các chiến lược xây dựng kho tài liệu của các thư viện và trung tâm lưu trữ truyền thống, những chiến lược dẫn đến một quyết sách đối với việc thu... cùng Bảo vệ tài liệu gốc ứng dụng cơ bản nhất của công nghệ số vào thư viện hoặc trung tâm lưu trữ là nhằm tạo ra những bản sao dạng số có đủ chất lượng để có thể dùng tham khảo thay thế cho việc tra tìm cẩu thả các tài liệu gốc Các tệp tin tham khảo là ảnh của các bộ sưu tập ảnh, các tập bài cắt báo dùng hoặc các tệp hồ mỏng cho phép định danh từng tài liệu đơn lẻ cần nghiên cứu sâu hơn là các ví... công nghệ thay đổi nhanh chóng Công nghệ ảnh số không chỉ là một lựa chọn chuyển tài liệu sang dạng khác Công nghệ ảnh liên quan đến việc chuyển đổi khái niệm định dạng, chứ không chỉ nhằm tạo ra một bức tranh chính xác về một cuốn sách, một tài liệu, một tấm ảnh, hoặc một bản đồ lên một phương tiện khác Cũng như việc sáng chế ra ống chân không mở ra một dạng truyền thông đại chúng hoàn toàn mới - phát . Chuyển dạng tài liệu dễ dàng hơn với công nghệ số Paul Conway - Trưởng phòng, Phòng Bảo quản, Thư. có nhiều vô số các kho tài liệu phức tạp và đa dạng thích hợp để chuyển sang dữ liệu số. Các nguồn đa dạng về kích cỡ, định dạng, chất liệu và điều

Ngày đăng: 19/03/2014, 22:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan