CHẨN ĐOÁN VÀ DỰ BÁO THỐNG KÊ CÁC QUÁ TRÌNH HẢI DƯƠNG HỌCSmirnov N. P., pptx

19 177 0
CHẨN ĐOÁN VÀ DỰ BÁO THỐNG KÊ CÁC QUÁ TRÌNH HẢI DƯƠNG HỌCSmirnov N. P., pptx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

NXB Đại học Quốc gia Hà Nội - Hà Nội - 2005 Từ khóa: Quá trình hải dương học, chẩn đoán, dự báo, thống kê, phương pháp hồi quy, thành phần chính, nhân tố, phương pháp phân loại, cấu trúc, biến động, ma trận số liệu, nhận biết phân biệt, khai triển trường, mô hình tuyến tính, đa chiều, phân tích quan hệ, dự báo tổ hợp. Tài liệu trong Thư viện điện tử Trường Đại học Khoa học Tự nhiên có thể được sử dụng cho mục đích học tập và nghiên cứu cá nhân. Nghiêm cấm mọi hình thức sao chép, in ấn phục vụ các mục đích khác nếu không được sự chấp thuận của nhà xuất bản và tác giả. CHẨN ĐOÁN VÀ DỰ BÁO THỐNG KÊ CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC Smirnov N. P., Vainovsky P. A., Titov Iu. E. Biêndịch: Phạm Văn Huấn SMIRNOV N. P., VAINOVSKY P. A., TITOV Iu. E. CHẨN ĐOÁN VÀ DỰ BÁO THỐNG KÊ CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC BIÊN DỊCH : PHẠM VĂN HUẤN NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA HÀ NỘI - 2005 Н. П. СМИРНОВ, П. А. ВАЙНОВСКИЙ, Ю. Э. ТИТОВ СТАТИСТИЧЕСКИЙ ДИАГНОЗ И ПРОГНОЗ ОКЕАНОЛОГИЧЕСКИХ ПРОЦЕССОВ Санкт-Петербург ГИДРОМЕТЕОИЗДАТ - 1998 1 Cuốn sách Chẩn đoán và dự báo thống kê các quá trình hải dương học tổng kết những kinh nghiệm ứng dụng các phương pháp thống kê nhiều biến vào nghiên cứu trường các yếu tố hải dương học diễn ra trong đại dương. Các tác giả giới thiệu tóm tắt về bản chất và ý nghĩa của các phương pháp phân tích thống kê hiện đại, quy trình tính toán thực tế khi áp dụng chúng vào các nhiệm vụ nghiên cứu cụ thể, không đi sâu vào khía cạnh toán học của vấn đề. Do đó cuốn sách sẽ là một tài liệu chỉ dẫn phù hợp cho những người không chuyên toán muốn ứng dụng công cụ thống kê toán học vào công việc nghiên cứu của mình. Đặc biệt, khi diễn đạt những bài toán nghiên cứu và dự báo thống kê các quá trình hải dương, các tác giả luôn chú trọng phương diện phương pháp luận nghiên cứu, cách đặt vấn đề, cách lý giải nội hàm của những kết quả nhận được, nhờ đó giúp c húng ta biết cách ứng dụng công cụ thống kê một cách khéo léo và hiệu quả. Các phương pháp thống kê nhiều biến cho phép người nghiên cứu phân tích toàn diện, đồng thời nhiều quá trình, nhiều đặc trưng hải dương học, từ đó nhận được quan niệm đầy đủ về những gì đang và sẽ diễn ra trong biển và đại dương, hình thành những mô hình về cấu trúc và biến động của quá trình, hiện tượng mà ta quan tâm. Hiện nay ở Việt Nam nguồn dữ liệu về các yếu tố thủy văn, thủy ho á, khí tượng, sinh học biển ngày càng được thu thập thêm, dần dần trở nên đồng bộ, phong phú. Với phương tiện tính toán ngày càng hiện đại, chắc chắn hướng nghiên cứu phân tích thống kê tự động sẽ phát triển và cuốn sách này sẽ hữu ích cho nhiều người nghiên cứu. Người biên dịch 2 MỤC LỤC MỞ ĐẦU 2 Chương 1 - MÔ TẢ MỐI LIÊN HỆ CỦA CÁC QUÁ TRÌNH 18 1.1. PHÂN TÍCH HỒI QU Y ĐA CHIỀU. HỒI QUY TUYẾN TÍNH ĐA CHIỀU 18 1.2. PHƯƠNG PHÁ P PHÂN TÍCH TƯƠNG QUAN CHUẨN HOÁ 25 Chương 2 - MÔ TẢ CẤU TRÚC CỦA CÁC QUÁ TRÌNH 29 2.1. PHƯƠNG PHÁ P THÀNH PHẦN CHÍNH 29 2.2. PHƯƠNG PHÁ P PHÂN TÍCH NHÂN TỐ 35 Chương 3 - PHÂN LOẠI CÁC QUÁ TRÌNH 43 3.1. PHƯƠNG PHÁ P PHÂN LOẠI TỰ ĐỘNG 43 3.2. PHƯƠNG PHÁ P PHÂN TÍCH PHÂN BIỆT 51 Chương 4 - NỘI DUNG DỰ BÁO CỦA CÁC PHƯƠNG PHÁP PHÂN TÍCH THỐNG KÊ ĐA CHIỀU 56 4.1. DỰ BÁO CẤU TRÚC CỦA CÁC QUÁ TRÌNH 56 4.2. DỰ BÁ O NHỮNG LỚP TRẠNG THÁI CỦA CÁC QUÁ TRÌNH 59 4.3. KẾT HỢP CÁC MÔ HÌNH DỰ BÁ O 61 4.4. TÍNH KHẢ BÁO THỐNG KÊ CỦA CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC 63 Chương 5 - NHỮNG KẾT QUẢ CHẨN ĐOÁN THỐNG KÊ CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC 67 5.1. CHẨN ĐOÁ N CÁC TRƯỜNG NHIỆT Ở BẮC ĐẠI TÂY DƯƠNG 68 5.2. CHẨN ĐOÁ N CẤU TRÚC NƯỚC BIỂN NA UY 77 5.3. CHẨN ĐOÁ N CẤU TRÚC CÁC KHỐI NƯỚC Ở BIỂN BELLINSHAUZEN 88 Chương 6 - NHỮNG KẾT QUẢ DỰ BÁO THỐNG KÊ CÁC QUÁ TRÌNH HẢI DƯƠNG HỌC 93 6.1. DỰ BÁO CÁC TRƯỜNG NHIỆT Ở BẮC ĐẠI TÂY DƯƠNG 94 6.2. DỰ BÁO ĐIỀU KIỆN BĂNG BIỂN BAREN 105 6.3. DỰ BÁ O PHÂN BỐ KHÔNG GIAN CỦA PHÙ DU SINH VẬT Ở BIỂN NA UY 110 KẾT LUẬN 114 TÀI LIỆU THA M KHẢO 116 MỞ ĐẦU Tính đa chiều và ngẫu nhiên trong biến động của các quá trình đại dương không cho phép người ta ngay tức khắc theo dõi, mô tả định lượng và lý giải cơ chế vật lý của chúng một cách đơn trị. Các phương pháp phân tích thống kê sẽ là một công cụ phát hiện và mô tả những mối quan hệ tương hỗ phức tạp đó để giải quyết các bài toán chẩn đoán và dự báo những quá trình đại dương. Độ chính xác và tin cậy của những kết luận nhận được phụ thuộc rất nhiều vào số lượng và sự đa dạng của thông tin ban đầu được đưa vào xử lý. Thực tế ta thấy t oàn bộ cơ sở thông tin được tích luỹ trên ba mặt phẳng: không gian − thời gian ),( tlX , không gian − dấu hiệu ),( zlX , dấu hiệu − thời gian ),( tzX ; tập hợp những thông tin này làm thành một khối lập phương dữ liệu với các trục: không gian ( l ), thời gian ( t ), các biến số (z ) (hình 0.1). Vậy các dữ liệu được sắp xếp trong khối lập phương đó như thế nào? Một quan trắc riêng lẻ x về một biến số nào đó, tại một điểm không gian, vào một thời điểm cho trước, sẽ là một ô duy nhất trong khối lập phương dữ liệu. Một chuỗi gồm N quan trắc {} N xxx , , , 21 sẽ là một vectơ nằm dọc theo trục tương ứng của khối lập phương. Thí dụ, bản ghi nhiệt độ nước ở một điểm tại những thời điểm N ttt , , , 21 sẽ cho ta một vectơ quan trắc )(tX , trong khối lập phương dữ liệu nó sẽ song song với trục thời gian. Một quan trắc phân bố thẳng đứng của nhiệt độ nước sẽ là một vectơ dữ liệu song song với trục không gian: )(l X . Nếu ta quan trắc liên tiếp theo thời gian về phân bố thẳng đứng của nhiệt độ nước tại một điểm, ta sẽ nhận được một mặt phẳng dữ liệu nằm trong khối lập phương song song với mặt phẳng các dấu hiệu: 3 ),( ltX . Còn nếu như đồng thời với nhiệt độ, ta quan trắc nhiều lần các tham số trạng thái đại dương khác (độ muối, vận tốc dòng chảy, các yếu tố hoá học), thì kết quả là ta nhận được khối lập phương dữ liệu phủ đầy tất cả các trục tọa độ đã chọn: ),,( zlt X . Trong các phương pháp phân tích dữ liệu đơn chiều, người ta xét chuỗi quan trắc trong thời gian hoặc trong không gian và nghiên cứu được tính chất của sự biến động (tuần hoàn, ngẫu nhiên ), sự đồng nhất của các dao động, sự liên hệ của vectơ quan trắc [104, 123, 201]. Khi đó thực tế ta không xét tới mặt phẳng quan trắc về những tham số khác nhau. Và mặc dù có những hiệu quả nhất định, các phương pháp thống kê đơn chiều khô ng cho phép phân tích một cách đầy đủ cần thiết về quá trình phức tạp đa tham số. X(t,l,z) X(l) X(z) X(t) X(z) X(t) X(l) X(l,z) X(z,t) X(l,t) Hình 0.1. Khối lập phương dữ liệu hải dương học: Các mặt phẳng và vectơ quan trắc hợp phần Các phương pháp phân tích cặp các chuỗi (phân tích tương quan, hồi quy, phổ) nhằm mục đích mô tả thống kê về mối liên hệ tương hỗ của hai vectơ quan trắc trong thời gian hay trong không gian: )( 1 tX , )( 2 tX ; )( 1 lX , )( 2 lX . Ở đây người ta vừa phân tích từng vectơ riêng biệt, vừa phân tích mức độ quan hệ cặp đồng bộ hay bất đồng bộ giữa chúng. Vậy là người ta đã nghiên cứu cấu trúc thống kê của quá trình một cách đầy đủ hơn so với phân tích đơn chiều. Nhưng chỉ tr ong các phương pháp phân tích thống kê đa chiều thì mới thực sự có khả năng khảo sát đồng thời một tập hợp các vectơ quan trắc. Các phương pháp phân tích thống kê đa chiều hướng tới giải quyết các bài toán phân tích thống kê đối với những ma trận gồm N quan trắc (các đối tượng) về M biến số (các dấu hiệu). Ở đây, những ma trận có thể là những bảng số nhận được bằng cách cắt khối lập phương dữ liệu dọc theo một mặt bất kỳ nào đó. Đây có thể là những ma trận quan trắc trong các mặt phẳng: các biến số − thời gian ),( tzX , các biến số − không gian ),( lzX hoặc thời gian − không gian ),( ltX . Ta có thể đưa trục các dấu hiệu vào phân tích thì cũng hoàn toàn như vậy, đó là ưu điểm rõ rệt của phân tích thống kê đa chiều, nó cho phép khảo sát khối lập phương dữ liệu một cách toàn thể. Những tập phân bố đồng thời của các đặc trưng quan trắc được phân tích bằng các phương pháp phân tích các vectơ và các ma trận, với chúng, bằng phép phân tích thống kê đa chiều sẽ đưa ra sự mô tả định lượng về những mối liên hệ tương hỗ ẩn bên trong các tham số ban đầu và phát hiện ra nội hàm của các mô hình chẩn đoán và dự báo các quá trình hải dương đa chiều được nghiên cứu. Khái niệm c hẩn đoán Theo từ điển các từ nước ngoài, thì chẩn đoán là quá trình xác định thực chất của bệnh và trạng thái của bệnh nhân trên cơ sở khám xét toàn diện về anh ta. Áp dụng vào hải dương học thực hành, bản chất của thuật ngữ này không có gì đổi khác nhiều lắm. Ta có thể định nghĩa như sau: Chẩn đoán là tuần tự những thủ tục tổng kết, hệ thống hoá và lý giải về sự biến động quan sát thấy của các đặc trưng hải dương nhằm hình thành một mô hình tin cậy về các quá trình đang diễn ra. Chẩn đoán đòi hỏi hai giai đoạn cơ bản: phân tích và tổng hợp. Phân tích, tức tách bạch đối tượng nghiên cứu thành những hợp phần, là giai 4 đoạn nghiên cứu đầu tiên. Giai đoạn này có thể bao gồm nhiều phương pháp biến đổi dữ liệu quan trắc và các tính toán để mô tả các hợp phần và những hiện tượng riêng lẻ của các quá trình. Nội dung chính của một phương pháp phân tích bất kỳ − phương pháp vật lý, thực nghiệm, thống kê hay số trị − là làm sao phát hiện và mô tả những yếu tố hợp thành các quá trình đang diễn ra. Tổng hợp là giai đoạn kết thúc của chẩn đoán và hướng tới liên kết những bộ phận cấu thành đơn lẻ, hay những tính chất đơn giản nhất đã phát hiện được, thành một chỉnh thể nào đó. Nguyên tắc cơ bản của sự liên kết này là hình thành một cách lôgic bức tranh hoàn chỉnh về các sự kiện đang diễn ra trên cơ sở những quy luật và những mối liên hệ của các yếu tố đã phát hiện được ở giai đoạn phân tích. Thực chất thì tổng hợp bao gồm nhiều phương pháp trong số các phương pháp phân tích, nhưng chúng được áp dụng với chức năng nội dung và mục tiêu khác − để liên kết và hệ thống hoá những hợp phần đã biết. Ngoài ra, tổng hợp gồm cả sự lý giải về hệ thống các quy luật đã thấy được. Lý giải được hiểu là sự giải thích vật lý về những quy luật đã phát hiện, nêu ra cơ chế vật lý chung trong sự xuất hiện và phát triển của các hiện tượng đang diễn ra trong đại dương. Tác giả công trình này gộp vào khái niệm chẩn đoán toàn bộ những thủ tục biến đổi thông tin hải dương học đa dạng trong quá trình nghiên cứu sự vận hành của hệ thống "đại dương" trong quá khứ hay hiện tại. Vì vậy, có hai loại thủ tục chẩn đoán sau đây với tư cách là những bộ phận cấu thành của chẩn đoán: chẩn đoán vật lý và chẩn đoán thống kê. Những khái niệm này khác nhau về dấu hiệu kỹ thuật hay dấu hiệu tính toán. Chẩn đoán vật lý bao gồm c ác thủ tục và phương pháp xác định trạng thái đại dương, được xây dựng trên cơ sở mô tả những hiện tượng và quá trình hải dương bằng cách tính toán và phân tích những đặc trưng thủy vật lý. Theo nội dung, chẩn đoán vật lý có tính truyền thống. Trước hết, nó gồm những phương pháp hải dương học tính toán những đặc trưng trạng thái đại dương không trực tiếp quan trắc, những đặc trưng thứ sinh. Đó là những tham số đặc trưng cho các trường vật lý, động lực, năng lượng, ta có thể kể ra rất nhiều. May thay, tất cả những tham số đó liên hệ với những đặc trưng nguyên sinh thông qua những quy luật vật lý đã biết và tạo thành một tập hợp các biến đặc trưng một cách đơn trị cho những dạng quá trình hải dương cụ thể. Ý nghĩa của chẩn đoán vật lý còn ở chỗ nó khái quát những biến đổi đang diễn ra trong đại dương thông qua một hệ thống những thuật ngữ và phạm trù đã biết và chấp nhận trong hải dương học. Đó là những yếu tố cân bằng nhiệt (entalpy, các dòng nhiệt), những yếu tố cấu trúc ngang và thẳng đứng của nước (các khối nước, front và đới chuyển tiếp, các xoáy nước và các hệ thốn g hoàn lưu) v.v Đối với những loại thuật ngữ cụ thể đã có những hệ phương pháp phân tích chuyên biệt. Thông thường , hệ phương pháp phân tích vật lý là một tổ hợp gồm những phương pháp kinh nghiệm phân tích định lượng kết hợp với những phương pháp thực tiễn xử lý và mô tả định tính. Có sự liên kết đó là nhờ kinh nghiệm nhiều năm nghiên cứu thực tế, thường thì không phải là kết quả của những nghiên cứu một cách hệ thống và có định hướng, mà là do người ta khái quát những điều đáng q uan tâm từ hoạt động thực tiễn. Thí dụ, phương pháp l uận phân tích ST , đối với các khối nước [23,125] là một thành tựu cơ bản của khoa học, cho phép hiểu và mô tả những quá trình quan trọng nhất hình thành cấu trúc khối nước. Trong khi đó hệ phương pháp mô tả điều kiện băng và trạng thái mặt biển theo thang điểm là đúc rút từ những nhu cầu thực tiễn hàng hải. Phần lớn những phương pháp phân tích vật lý các quá trình hải dương kết hợp những cơ sở của phép phân tích định lượng các quan trắc với những giải pháp lý luận tập hợp, chuẩn bị và xử lý thông tin hải dương học. Những quy tắc lý thuyết đồng thời là cơ sở để lý giải tiếp theo về những ước lượng định lượng về phương diện hải dương học. Về toàn cục thì thực tiễn phân tích vật l ý đối với những quá trình hải 5 dương là một phương pháp luận đã hình thành, hoàn chỉnh và rất hiệu quả trong xử lý thông tin hải dương học. Những nguyên tắc của chẩn đoán thống kê Chẩn đoán thống kê yêu cầu sử dụng các phương pháp thống kê để xử lý, phân tích và lý giải thông tin hải dương học đa dạng. Phương pháp luận của chẩn đoán thống kê dựa trên nhiều phương pháp phân tích thống kê và thể hiện dữ liệu. Chẩn đoán t hống kê có nhiều triển vọng ứng dụng thực tế trong nghiên cứu hải dương học. Đó là do hiện nay có rất nhiều phương pháp thống kê biến đổi thông tin. Song việc sử dụng chẩn đoán thống kê trong thực tế hiện còn rất hạn chế. Về điều này có một số nguyên nhân. Thứ nhất, rõ ràng rằng trong giới những người nghiên cứu ứng dụng chưa hiểu sâu sắc về chính hệ thống các tính toán thống kê và sự liên hệ ràng buộc bên trong của các phương pháp thống kê khác nhau. Thực chất điều này cản trở việc sử dụng nhiều phương pháp để hình thành và kiểm tra các giả thuyết thống kê, chấp nhận những quyết định có căn cứ thống kê để khảo sát định lượng toàn diện về những mối liên hệ lẫn nhau giữa các đặc trưng hải dương học. Chúng tôi cho rằng chính là sự thiếu hiểu biết thực dụng về bản chất của phương pháp luận thống kê đã làm nảy sinh sự hoài nghi đối với nó. Kết quả là sự chẩn đoán bị quy về ứng dụng thực tế một số thủ pháp phương pháp luận riêng biệt, những thủ p háp này mặc dù chưa phải là tối ưu để giải quyết các bài toán cụ thể, nhưng chúng được dùng quen, ổn định, thành tập tục lịch sử, không gây cho nhà nghiên cứu những bất trắc nào. Thứ hai, áp dụng những phương pháp phân tích thống kê hiện đại phải đi kèm với cơ sở kỹ thuật tương ứng. Những tính năng của các máy tính hiện có đôi khi quyết định giới hạn của việc phân tích thống kê thông tin trong thực tế. Khác với những tính toán thủy động lực, thống kê đòi hỏi không chỉ tốc độ máy tính, mà chủ yếu là dung lượng nhớ lớn. Bộ nhớ trong và bộ nhớ ng oài quy định khả năng áp dụng nhiều phương pháp tiếp cận hữu hiệu, trong đó có những phương pháp phân tích thống kê nhiều biến. Cuối cùng, nguyên nhân thứ ba là do tình trạng lưu giữ thông tin hải dương học vào máy tính rất chậm trễ. Như đã biết, hiệu quả của việc xử lý những mảng dữ liệu lớn tuỳ thuộc rất nhiều vào trình độ tổ chức thông tin. Tính tin cậy của những kết luận thống kê liên quan với độ dài tập mẫu nghiên cứu. Vì vậy, sự tích luỹ thông tin và lưu giữ chúng một cách có tổ chức có thể xem là con đường nhanh nhất để phát triển các phương pháp chẩn đoán thống kê. Bản chất của c hẩn đoán thống kê là phân tích định lượng một tập hợp những đặc trưng hải dương học, thành lập những mô hình thống kê tối ưu về những quá trình được quan trắc, mô tả tiếp và lý giải những quy luật và cơ chế vật lý hình thành nên tính biến động đại dương. Phương pháp luận phân tích thống kê được phổ biến rộng rãi nhất trong phân tích sơ bộ những chuỗi quan trắc (dựng tổ chức đồ, ước lượng các mômen thống kê bậc thấp), mô tả quan hệ các chuỗi (tương quan cặp và hồi quy), phát hiện quy luật biến động thời gian của các đặc trưng hải dương học (phân tích điều hoà, phổ, hiệp phổ). Trong khi đó các phương pháp phân tích nhiều biến nói chung hiện còn ít được dùng hơn, điều này hoàn toàn không tương xứng với sức mạnh thực tế của các phương p háp đó. Ta sẽ khái quát hoá những nhận xét trên đây về chẩn đoán vật lý và thống kê dưới dạng một sơ đồ trực quan đơn giản sao cho có thể tóm lược được những ý tưởng phương pháp luận của các hướng nghiên cứu khác nhau (hình 0.2). Thấy rằng k hối chẩn đoán thống kê liên quan trực tiếp với ba khâu của hệ thống xử lý: các cơ sở dữ liệu, chẩn đoán vật lý và hình thành tri thức của người dùng. Tương ứng với những mối liên hệ qua lại đó, có thể phát biểu những bài toán cơ bản của chẩn đoán thống kê gồm ba nhóm sau đây. 1. Những bài toán về xử lý sơ bộ các số liệu, bao gồm các thủ tục 6 hỡnh thnh nhng mng thụng tin ban u t cỏc c s d liu gc v trờn c s nhng kt qu tớnh toỏn cỏc c trng hi dng hc th sinh trong khi chn oỏn vt lý. 2. Nhng bi toỏn phõn tớch thng kờ thụng tin, th hin di dng mt lot vn c th v phõn tớch thng kờ ti u i vi ti liu. Thớ d, nhng bi toỏn v phỏt hin nhng hp phn tun hon trong bin thiờn thi gian v khụng gian, ỏnh giỏ nh lng mi liờn h gia cỏc dao ng ca nhng c trng hi dng hc trong khụng gian hay trong thi gian. Cơ sở dữ liệu Chẩn đoán thống kê Chẩn đoán vật lý Hình thnh bi toán Tính các đặc trng vật lý Phân tích vật lý các quá trình Lập các mô hình vật lý Lý giải kết quả Tính các đặc trng thống kê Phân tích thống kê các quá trình Lập mô hình thống kê Lý giải kết quả Tri thức Ngời sử dụng Chấp nhận quyết định Dự báo Hỡnh 0.2. S chc nng c hn oỏn cỏc quỏ trỡnh hi dng hc 3. Nhng bi toỏn giai on tng hp, khi nhng c lng nh lng thu c v cỏc mi liờn h thng kờ cn phi thng nht li di hỡnh thc nhng mụ hỡnh v hin tng, ỏng tin v mt thng kờ, sau ú lý gii theo tinh thn vt lý v c ch hot ng ca nhng mụ hỡnh nhn c theo thut ng hi dng hc v phự hp vi nhng tiờn vt l ý ó chp nhn khi phõn tớch. S khi tr ờn õy vn hnh thnh cụng hay khụng tu thuc vo tng quan gia trỡnh tri thc ca ngi s dng nhng kt qu chn oỏn v tớnh hiu qu ca nhng quyt nh thc tin chp nhn trờn c s tri thc ú. Nu hiu s gia hai hp phn ny õm thỡ s phỏt sinh yờu cu tip tc nghiờn cu. Nu hiu dng s ny sinh kh nng tip tc s dng tri thc, thớ d, di dng cỏc d bỏo s phỏt trin ca nhng quỏ trỡnh hi dng trong thi gian hay trong khụng gian. S thnh cụng trong gii quyt nhng bi toỏn chn oỏn thng kờ cỏc quỏ trỡnh hi dng tu thuc rt nhiu vo tớnh hiu qu ca vic ỏp dng cỏc phng phỏp c th x lý thng kờ thụng tin. V hỡnh thc, khi chn oỏn thng kờ l mt tun t nhiu phng phỏp ca thng kờ hc, vic chn v c th hoỏ chỳng c thc hin phự hp vi nhng mc tiờu chung ca ngi ng hiờn cu. Tuy nhiờn, cú th nờu ra mt s nguyờn tc c bn trong khi chn v ng dng cỏc phng phỏp thng kờ trong chui chung chn oỏn cỏc quỏ trỡnh hi dng. Nguyờn tc b sung. Theo nguyờn tc ny, nhng phng phỏp c chn phi dn ti nhng kt qu sao cho cú th xõy dng c bc tranh y nht v cỏc hin tng ang din ra. Nh vy cng chớnh l nhn mnh rng phi loi tr s lp li nhiu ln nhng kt qu. Cú cn phõn loi mt tp mu m v tp mu ú tt c nhng ch tiờu ng nht ó c khng nh trc kh ụng? Tuy nhiờn, trong thc t cng cú th cn phõn loi nhiu ln mt tp mu theo nhiu ch tiờu v quy tc phõn loi khỏc nhau lm sao chn c mt cu trỳc lp n nh nht v cú cn c vt lý nht. í ngha ca quy tc ny l ch sao cho kt qu ln sau m rng nhng quan nim ca chỳng ta v i tng nghiờn cu ó thu c ln chn oỏn trc. 7 Nguyên tắc kết hợp các phương pháp để liên tục áp dụng những phương pháp nghiên cứu phức tạp hơn. Những phương pháp xử lý thống kê đơn sơ hơn thì cho những kết quả thô, gần đúng, nhưng ít tốn thời gian. Phương pháp chính xác hơn thường phức tạp hơn và ít kinh tế hơn. Thông thường, sự phức tạp tính toán và tăng độ chính xác kết quả luôn dẫn tới thu hẹp phạm v i ứng dụng của hệ phương pháp. Độ tin cậy cao của một ước lượng thống kê chủ yếu là do tuân thủ nghiêm ngặt những điều giới hạn trong khi tính toán. Bài toán quen thuộc trong khí tượng thủy văn về tính các chuẩn nhiều năm của nhiệt độ nước là một minh hoạ về điều vừa nêu. Ước lượng gần đúng trung bình số học theo chuỗi quan trắc dài tỏ ra không có gì kém so với những ước lượng tinh xảo kỳ vọng toán học thực hiện bằng nhiều phương pháp phức tạp với xấp xỉ không dừng. Nguyên tắc kế thừa cho p hép dần dần đạt tới độ tin cậy cực đại của kết quả tính toán với độ mạo hiểm tối thiểu. Nguyên tắc này tạo ra khả năng phân chia thành từng pha các phương pháp chẩn đoán thống kê những quá trình hải dương. Một pha là một nhóm các phương pháp xử lý thống kê gồm một số những tính toán khép kín, người sử dụng kiểm soát tính hiệu quả của nó. Thí dụ, khi tính các thành phần chính, có thể tổ chức một pha tính mỗi thành phần và khôi phục giá trị của thành phần đó. Sau khi kiểm tra tính hội tụ và tính lý giải được của các thành phần, người sử dụng quyết định cần tiếp tục khai triển hay kết thúc các thủ tục tính toán. Trình tự chẩn đoán thống kê Trong thực tế có thể thực hiện những nguyên tắc chẩn đoán thống kê chung nhất đã liệt kê trên đây dưới dạng những sơ đồ tính toán thống kê. Ta sẽ dừng lại ở một trong những phương án khả dĩ tỏ ra rất hiệu quả trong nghiên cứu các quá trình hải dương quy mô lớn. Sơ đồ chẩn đoán thốn g kê này (hình 0.3) hình thành trên cơ sở những nguyên tắc đã xét ở trên như một bộ phận hợp thành của một quá trình chung xử lý thông tin hải dương học. Giai đoạn phân tích gồm bốn nhóm phương pháp xử lý. Xử lý bước đầu được chia thành một khối độc lập để nhấn mạnh tầm quan trọng và sự cần thiết của việc lựa chọn ban đầu thật cẩn t hận các tham số phân tích thống kê. Rõ ràng, việc chọn lựa cụ thể những t ham số phải xuất phát từ các điều kiện phát biểu bài toán chẩn đoán. Sau khi có kết quả chẩn đoán vật lý, ở mức định tính chúng ta đã có thể tiên đoán khả năng đưa thêm những tham số bổ sung vào danh sách các mối liên hệ cần nghiên cứu. Trong danh sách đã có thể đưa thêm những biến không trực tiếp quan trắc, nhưng có thể tính được trong quá trình chẩn đoán vật lý. Phân tích thống kê ban đầu trong chẩn đoán thống kê có thể được xem vừa như là mục tiêu nghiên cứu, vừa như là giai đoạn tính toán trung gian. Trong mọi trường hợp thì kết quả phân tích thống kê ban đầu là nền tảng để lý giải về tính ổn định và tính biến động của các tham số, tính đồng nhất và tính dừng của các thành phần riêng biệt của các quá trình được nghiên cứu. Cần tách riêng các phương pháp ước lượng trị số của những mômen thống kê đầu tiên và thuật toán tính toán các tổ chức đồ thực nghiệm một chiều và hai chiều như là những thủ tục tính toán các đặc trưng thực nghiệm quan trọng của những quá trình hải dương. Các ước lượng thống kê − trung bình, phương sai, các hệ số biến phân, độ bất đối xứng, độ nhọn, các tham số phân bố xác suất, là thông tin quan trọng về cấu trúc nội tại của biến động thời gian hay không gian của các quá trình. Trên cơ sở đó hình thành quan niệm ban đầu về biến động nền của các hiện tượng nghiên cứu nói chung. Phân tích các chuỗi t hời gian được tách thành một khối riêng biệt, vì trong đó những thuật toán ước lượng định lượng về mức độ có quy luật trong sự biến thiên các đặc trưng hải dương học theo thời gian được liên kết thành một chuỗi những tính toán liên quan nhau một cách lôgic. Những ý tưởng phân tích chuỗi thời gian đã được xét chi tiết và toàn diện 8 trong nhiu chuyờn kho v nhng vn phõn tớch xỏc sut cỏc quỏ trỡnh hi dng [69, 151, 193]. õy cn nhn mnh ý ngha to ln ca phộp phõn tớch thng kờ tng hp i vi cỏc quỏ trỡnh hi dng a chiu trong h phng phỏp ny. Phân tích Xử lý bớc đầu Chọn các tham số Hình thnh các tập mẫu Phân tích thống kê ban đầu Phân tích các chuỗi thời gian Phân tích thống kê đa chiều Lựa chọn mô hình thống kê Lý giải các đặc trng thống kê Tổng hợp Hỡnh 0.3. S chc nng ca chn oỏn thng k ờ cỏc quỏ trỡnh hi dng Tỏch ra tớnh bin thiờn cú quy lut ca chui thi gian cú ngha l nhn nhng c lng tin cy ca nhng c trng v tớnh ngu nhiờn hay tớnh cú quy lut trong bin thiờn thi gian. Rừ rng, phỏt hin ra nhng quy lut l kt qu quan trng khi phõn tớch cỏc chui thi gian. Trc ht quy lut c hiu l s tun hon lp li tim n trong cỏc dao ng ca cỏc c trng hi dng hc m ngi ta gii thớch nh l s biu hin ca cỏc c ch hỡnh thnh cỏc quỏ trỡnh nghiờn cu bi nhng nhõn t bờn ngoi hay bờn trong. Vỡ vy cỏc phng phỏp phõn tớch iu ho ca Fourier, phng phỏp phõn tớch biu chu k, phõn tớch ph c phỏt trin mnh m nht. i dng l mt h thng phc tp gm n hng mi liờn h cu trỳc nhiu tng, gm c mt di rng tn s dao ng riờng v dao ng cng bc. Chớnh tớnh cú cu trỳc ca h thng ó cho phộp chỳng ta sau khi xp x ỏnh giỏ c cu trỳc tn s ca cỏc quỏ trỡnh, cú th ngay tc khc xp cỏc hin tng ang xột vo mt thang bc nht nh trong s a tng bin ng i dng. Tu y nhiờn, kinh nghim cho thy rng tp hp cỏc tn s dao ng c trng l cú hn v thc t nú nm gn trong di bin ng t c vi phỳt n vi nghỡn nm, iu khng nh ny chớnh xỏc v tin cy i vi nhng nhu cu thc tin v lý thuyt hin nay. Ta ó bit rng cu trỳ c tn s trong s tng tỏc gia cỏc thnh t ca h thng khớ hu cú s bc t do rt khỏc nhau. Vic mụ t nhng mi liờn h qua li trong cỏc dao ng ca nhng c trng hi dng hc trong min tn s c thc hin bng cỏc phng phỏp phõn tớch ph tng h; theo phng phỏp ny, t cỏc c lng ph dao ng ng pha v k hụng ng pha, hip bin v pha cỏc dao ng, ta s cú c quan nim v s hin din hay khụng hin din ca nhng tng tỏc cú tớnh tun hon gia hai chui thi gian. Cũn cú mt nhúm cỏc bi toỏn phõn tớch chui thi gian liờn quan ti vic mụ t nhng dao ng tun hon chu k di trong cỏc quỏ trỡnh ban u, gi l "xu th". Bi toỏn mụ t xu th chc chn khụng nờn coi l bi toỏn tm thng v cú l nú cng l bi toỏn cũn lõu mi hon thin. Theo truyn thng thỡ cỏc nh nghiờn cu xem xu th l mt th nhiu khụng mong mun. Nguyờn nhõn l do xu th phỏ hu iu kin dng ca cỏc chui thi gian, lm gim mnh hiu qu ca cỏc phng phỏp phõn tớch tng quan v ph kinh in. Thc vy, tớnh khụng dng v k vng toỏn hc, v cỏc c trng biờn v pha dao ng lm gim tin cy ca nhng c lng ca cỏc thnh phn tt nh , vỡ phn ln trng hp trong thc t cỏc c lng ny c tớnh theo nhng thut toỏn ỏp dng i vi nhng tp mu dng. Chớnh vỡ vy m ngi ta thng mun bng mi cỏch loi b cỏc xu th trong cỏc chui. [...]... TIN Chẩn đoán vật lý Chẩn đoán thống kê Phân tích Tính các đặc trng vật lý bổ sung của quá trình Phân tích thống kê ban đầu các biến xuất phát Lý giải các kết quả chẩn đoán thống kê định lợng Phân tích đa chiều Dự báo thống kê Lựa chọn các mô hình dự báo Ước lợng các tham số dự báo Phân tích các mối liên hệ giữa các biến của quá trình Phân tích cấu trúc quá trình Phân loại trạng thái của quá trình. .. các đặc trng đợc nghiên cứu trong hệ quy chiếu trực chuẩn (các đa thức chuẩn, các thnh phần chính, các nhân tố chung, các biến chuẩn hoá) Phân loại các quá trình đợc nghiên cứu trong không gian các biến xuất phát (phân loại tự động, phân tích Mô tả biến động các quá trình bằng các phơng pháp phân tích bớc đầu đối với những chuỗi thời gian trong hệ quy chiếu trực chuẩn Phân loại các quá trình theo các. .. quy chiếu (phân loại tự động, phân tích nhận dạng) Mô tả các đặc trng thống kê của những loại, những lớp đã đợc tách ra bằng các phơng pháp phân tích bớc đầu v phân tích các chuỗi Phân tích cấu trúc các lớp, các quá trình bên trong các lớp bằng cách khai triển trong hệ quy chiếu trực chuẩn (các đa thức, các thnh phần chính, các nhân tố chung, các biến chuẩn) Hỡnh 0.4 S chc nng trỡnh t phõn tớch thng... biến của quá trình Phân tích cấu trúc quá trình Phân loại trạng thái của quá trình Tổng hợp Ho hợp các kết quả phân tích Phát biểu mô hình chẩn đoán tối u Kết hợp (tổng hợp) các mô hình dự báo bộ phận Kiểm tra các mô hình v phân tích sai số Đánh giá tính có thể dự báo đợc bằng thống kê Lý giải dự báo v sai số Ngời dùng Hỡnh 0.5 S chc nng chn oỏn v d bỏo cỏc quỏ trỡnh hi dng Phõn tớch thng kờ tỏc... Tớnh thay th c ca cỏc khi, hon thin cỏc khi, cui cựng cho phộp ngi nghiờn cu xỏc nh c nhng kh nng ca mụ hỡnh, tc thc hin vic kim tra cỏc mụ hỡnh d bỏo v a ra ỏnh giỏ khỏch quan cui cựng v mụ hỡnh ang dựng Phõn loi cỏc phng phỏp d bỏo Ngy nay, d bỏo mt quỏ trỡnh a chiu l mt bi toỏn tng i c bit trong thc tin nghiờn cu d bỏo hin i i vi hi dng hc, thỡ in hỡnh nht l d bỏo quỏ trỡnh mt chiu, gi l d bỏo mt... tht bi vi t d bỏo m ch s dng mt trong nhng phng phỏp n gin nht phõn tớch xu th hoc xp x Fourier Trong khi ú, cũn c mt lot cỏc phng phỏp t d bỏo thng kờ xỏc sut cú rt nhiu kh nng thỡ nhỡn chung cha c dựng ti S phỏt trin v hon thin ca cỏc phng phỏp thng kờ cho phộp nhỡn nhn tng quan gia cỏc d bỏo a tham s v t d bỏo t nhng quan im mi, trc tip da theo kt qu chn oỏn cỏc quỏ trỡnh hi dng a chiu Vic ng dng... mt vo nhit , mui, ỏp sut trong cỏc phng trỡnh trng thỏi nc bin thc nghim Chớnh phng phỏp ny c s dng khi lp nhng cụng thc tớnh v d bỏo iu kin bng theo cỏc c trng khớ tng Phng phỏp tip cn tng t cng c dựng khi kho sỏt s ph thuc ca cỏc tham s súng vo tc giú, di giú Tỡm cu trỳc tim n trong cỏc d liu khớ tng thy vn cú ngha l phỏt hin nhng quy lut c bn ca nhng bin khụng gian thi gian Trong hi dng hc... gian thi gian Phi tha nhn phng phỏp khai trin n gin nht l cỏc th tc khai trin theo cỏc a thc i s, trong ú cỏc a thc Chebsev v Fourier l ph dng nht Phng phỏp cỏc thnh phn chớnh cng c s dng rng rói, mc dự nú cú phn phc tp hn Phng phỏp phõn tớch nhõn t tm thi ớt c ng dng trong hi dng hc thc hnh, song trong cỏc lnh vc khoa hc khỏc (khớ tng hc, sinh hc, xó hi hc, kinh t hc) nú t ra rt hu hiu S hiu qu ca . NXB Đại học Quốc gia Hà N i - Hà N i - 2005 Từ khóa: Quá trình hải dương học, ch n đo n, dự báo, thống k , phương ph p hồi quy, thành ph n chính, nh n t , phương ph p ph n loại, cấu trúc,. hải dương học. Những nguy n tắc của ch n đo n thống kê Ch n đo n thống kê yêu cầu sử dụng các phương ph p thống kê để xử l , ph n tích và lý giải thông tin hải dương học đa dạng. Phương ph p. là con đường nhanh nhất để phát tri n các phương ph p ch n đo n thống kê. B n chất của c h n đo n thống kê là ph n tích định lượng một t p h p những đặc trưng hải dương học, thành l p những

Ngày đăng: 09/08/2014, 16:21

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan