Bài giảng Lập trình cơ bản - Bài 5: Giải thuật xử lý thông tin và ngôn ngữ lập trình

ppt 36 trang hoanguyen 4540
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lập trình cơ bản - Bài 5: Giải thuật xử lý thông tin và ngôn ngữ lập trình", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptbai_giang_lap_trinh_co_ban_bai_5_giai_thuat_xu_ly_thong_tin.ppt

Nội dung text: Bài giảng Lập trình cơ bản - Bài 5: Giải thuật xử lý thông tin và ngôn ngữ lập trình

  1. KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN CÔNG NGHỆ PHẦN MỀM Bài 5. Giải thuật xử lý thông tin và ngôn ngữ lập trình Bài giảng: LẬP TRÌNH CƠ BẢN
  2. Tài liệu tham khảo  Giáo trình tin học cơ sở, Hồ Sỹ Đàm, Đào Kiến Quốc, Hồ Đắc Phương. Đại học Sư phạm, 2004 – Chương 7, 9. 2 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  3. NỘI DUNG  Khái niệm bài toán giải thuật  Đặc trưng của giải thuật  Các phương pháp diễn đạt giải thuật  Sơ lược về đánh giá giải thuật  Ngôn ngữ lập trình và các mức khác nhau của ngôn ngữ lập trình  Quá trình thực hiện chương trình trên ngôn ngữ bậc cao 3 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  4. Input Yêu cầu KHÁI NIỆM BÀI TOÁN Output Cho số tự n có phải số “có” hay nhiên n nguyên tố hay “không” không Cho hồ sơ Tìm tất cả các sinh Danh sách sv điểm sinh viên viên có điểm trung thoả mãn bình trên 8 Thiết kế hình Tính sức bền Độ bền học, tải trọng Cho một bài toán nghĩa là cho input, và yêu cầu để tìm (tính) ra output 4 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  5. KHÁI NIỆM THUẬT TOÁN  Thuật toán (algorithm) là một quá trình gồm một dãy hữu hạn các thao tác có thể thực hiện được sắp xếp theo một trình tự xác định dùng để giải một bài toán  Ví dụ : thuật toán Euclid tìm ước số chung lớn nhất của hai số tự nhiên. Thay vì phải tính toán theo định nghĩa chỉ làm rõ cấu trúc của USCLN (tích của các ước số chung với số mũ nhỏ nhất) thuật toán Euclid dựa trên các tính chất sau:  USCLN(a,b) = USCLN (b,a))  Nếu a> b, USCLN(a,b) = USCLN (a-b,b)  USCLN(a,a)= a 5 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  6. THUẬT TOÁN EUCLID TIM USCLN CỦA HAI SỐ TỰ NHIÊN  Bài toán: Cho hai số m, n tìm d = USCLN(m,n) 1. Bước 1: Kiểm tra nếu m= n thì về bước 5, nếu không thực hiện tiếp bước 2 2. Bước 2: Nếu m> n thì về bước 4 nếu không thực hiện tiếp bước 3 3. Bước 3: m <n, bớt n đi một lượng bằng m và quay về bước 1 4. Bước 4: bớt m đi một lượng bằng n và quay về bước 1 5. Bước 5: Lấy d chính là giá trị chung của m và n. Kết thúc 6 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  7. VÍ DỤ CÁC BƯỚC CỦA THUẬT TOÁN EUCLID m n m n 15 6 9 6 m>n 3 6 m<n 3 3 m=n USCLN(15,21) = 3 7 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  8. CÁC ĐẶC TRƯNG CỦA THUẬT TOÁN  Input  Output  Tính xác định: Sau mỗi bước, bước tiếp theo hoàn toàn xác định.  Tính khả thi: các chỉ dẫn đặt ra đều có thể thực hiện được  Tính dừng: quá trình tính toán luôn phải dừng sau một số hữu hạn bước.  Tính phổ dụng: mỗi thuật toán không chỉ dùng cho một bài toán với dữ liệu cụ thể mà có thể áp dụng với một lớp các bài toán cùng kiểu. Chẳng hạn người ta nói tới thuật toán tìm USCLN của hai số tự nhiên bất kỳ chứ không phải thuật toán tìm USCLN của 15 và 21. 8 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  9. CÁC PHƯƠNG PHÁP BIỂU DIỄN THUẬT TOÁN  Dùng các chỉ dẫn  Dùng sơ đồ khối  Dùng cấu trúc điều khiển 9 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  10. THUẬT TOÁN BỐC SỎI  Ví dụ: Bài toán bốc sỏi: có 30 viên sỏi. Hai người chơi, mỗi người đến lượt mình bốc từ 1 đến 3 viên sỏi. Ai bốc cuối cùng là thắng. Làm thế nào để người đi trước thắng. 1. Bước 1, bốc 2 viên 2. Bước 2: nếu số sỏi đã hết, dừng cuộc chơi, tuyên bố người (đi trước) thắng cuộc. Nếu không về bước tiếp theo 3. Bước 3: Đối phương bốc k viên 0 < k<4 4. Bước 4: Người đi trước bốc một lượng là 4 - k sau đó quay về bước 2 10 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  11. BIỂU DIỄN BẰNG LƯU ĐỒ HOẶC SƠ ĐỒ KHỐI Khối thao tác Khối output đối tượng:= biểu Khối input Khối input thức Khởi đầu Kết thúc Khối điều kiện + - Thứ tự xử lý 11 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  12. BIỂU DIỄN BẰNG LƯU ĐỒ THUẬT TOÁN EUCLID m,n m=n? - + m>n ? d:= m + - m:=m-n n:= n - m d 12 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  13. BIỂU DIỄN BẰNG CẤU TRÚC ĐIỀU KHIỂN Trong khi m n thì lặp lại khối sau: read(m,n); Nếu m > n thì while m n then Điều chỉnh lại giá trị Nếu ngược lại thì m:=m-n của m và n Bớt n đi một lượng là m else Cho tới khi m = n thì tuyên bố USCLN n:= n-m; chính là giá trị chung của m và n write(m); Chương trình trong PASCAL 13 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  14. TÍNH NGHIỆM XẤP XỈ VỚI ĐỘ CHÍNH XÁC ε = 0.000001 CỦA PHƯƠNG TRÌNH f(x)= ex- x3 = 0 Sử dụng thuật toán chia đôi dựa vào tính chất: nếu một hàm f liên tục trên đoạn [a,b] có f(a) và f(b) thì phương trình f(x) = 0 nhất định thừa nhận một nghiệm c nằm giữa [a,b] Phương trình có hai nghiệm như trong hình vẽ. Ta vây nghiệm nhỏ hơn trong đoạn [1,4] 14 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  15. TÍNH NGHIỆM XẤP XỈ VỚI ĐỘ CHÍNH XÁC ε = 0.000001 CỦA PHƯƠNG TRÌNH f(x)= ex- x3 = 0 Ta có f(a)>0, f(b) 0 thay a bởi c, sau đó thực hiện bước 4 3. Nếu f(c) ε, quay về 1, nếu không làm tiếp 5. Dừng, lấy c làm nghiệm 15 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  16. TÍNH NGHIỆM XẤP XỈ VỚI ĐỘ CHÍNH XÁC ε = 0.000001 CỦA PHƯƠNG TRÌNH f(x)= ex- x3 = 0 a:= 1; b:= 4; ε = 0.00001 c:= (a+b)/2 f(c) >0 ? + - a:= c b:= c b-a < ε c - + 16 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  17. Chương trình trong BIỂU DIỄN BẰNG CẤU TRÚC ĐIỀU KHIỂN PASCAL Cho ε = 0.000001, a=1 b=4 a:=1; b:= 4; Lặp lại khối sau: epsi:= 0.000001; repeat Tính c:= (a+b)/2 c:= (a+b)/2; Tính f(c) Nếu f(c) > 0 thì thực hiện khối if epx(c)-sin(c) > 0 then Thay a bởi c a:=c Nếu ngược lại thì thực hiện khối else b:= c Thay b bởi c until b-a < epsi Cho tới khi b-a < ε thì lấy c làm write(c); nghiệm xấp xỉ 17 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  18. HIỆU QUẢ CỦA THUẬT TOÁN  Với mỗi bài toán có thể có nhiều thuật toán khác nhau. Tuy nhiên hiệu quả của chúng có thể rất khác nhau.  Trong tin học người ta quan tâm nhiều đến độ phức tạp về thời gian: giải bài toán đó cần bao nhiêu thời gian, vấn đề này được quy về số phép tính cơ bản cần được thực hiện  Độ phức tạp không gian: sự tiêu tốn không gian nhớ.  Vấn đề hiệu quả thời gian là vấn đề được nghiên cứu nhiều hơn cả. 18 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  19. VÍ DỤ HIỆU QUẢ TÌM KIẾM Ví dụ bài toán tìm kiếm: cho một dãy n số khác nhau a1,a2 ai an và một số x.Hãy cho biết x có trong dãy số đó hay không và ở vị trí thứ bao nhiêu. Thuật toán tìm kiếm tuần tự như sau:  Bước 1. Cho i = 1  Bước 2. Nếu ai = x thì chuyển tới bước 5, nếu không thực hiện tiếp bước 3  Bước 3. Tăng i lên 1 và kiểm tra i > n. Nếu đúng về bước 4. Nếu sai quay về bước 2  Bước 4. Tuyên bố không có số x. Kết thúc  Bước 5. Tuyên bố số x chính là số thứ i. Kết thúc Số bước tìm trung bình là n/2. Nếu có 1 triệu phần tử thì phải mất khoảng 500.000 phép so sánh 19 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  20. HIỆU QUẢ CỦA THUẬT TOÁN Nếu sắp xếp dãy số theo thứ tự tăng dần có thể tìm bằng thuật toán tìm kiếm nhị phân, với tư tưởng thu hẹp dần vùng tìm kiếm  Bước 1. Cho d := 1, c:=n (d: đầu, c: cuối, g: giữa)  Bước 2. Tính g := [(d+c)/2]  Bước 3. So x với ag. Nếu x=ag chuyển tới bước 7. Nếu khác thì tiếp tục thực hiện bước 4  Bước 4. Nếu d=c thì tuyên bố không có số x và kết thúc. Nếu không thì thực hiện bước 5 tiếp theo  Bước 5. Nếu x < ag thì thay c bằng ag và quay về bước 2. Nếu không thì thực hiện bước 6 tiếp theo  Bước 6. Thay d bằng ag và quay về bước 2  Bước 7. Tuyên bố số x chính là số thứ g. Kết thúc Cứ mỗi lần không tìm được ta lại giảm độ dài vùng tìm kiếm đi hai lần. Số bước tìm trung bình là log2n. Nếu có 1 triệu phần tử thì chỉ mất khoảng 20 lần tìm, rất nhỏ so với tìm tuần tự 20 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  21. NGÔN NGỮ LẬP TRÌNH  Ngôn ngữ lập trình (programming language) là ngôn ngữ biểu diễn thuật toán dùng để điều khiển máy tính thực hiện các công việc đã định.  Các quy tắc viết được gọi là cú pháp (syntax) của ngôn ngữ. ý nghĩa mà ngôn ngữ chuyển tải gọi là ngữ nghĩa (semantic)  Một chương trình máy tính (program)phải được thể hiện trên một ngôn ngữ xác định. Như vậy một thuật toán có thể diễn đạt bằng nhiều chương trình khác nhau trên những ngôn ngữ khác nhau. 21 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  22. CÁC MỨC CỦA NGÔN NGỮ LẬP TRÌNH  Ngôn ngữ máy: ngôn ngữ thể hiện trực tiếp trong hệ lệnh của máy. Nói chung ngôn ngữ máy là ngôn ngữ ở mức các bít, nên cũng được gọi là ngôn ngữ nhị phân  Hợp ngữ (assembly) là loại ngôn ngữ về cơ bản là gần với ngôn ngữ nhị phân, mỗi lệnh của ngôn ngữ máy có một lệnh tương ứng của hợp ngữ nhưng hợp ngữ sử dụng mã chữ  Ngôn ngữ bậc cao – còn gọi là ngôn ngữ thuật toán (Algorithmic language) là ngôn ngữ biểu diễn thuật toán độc lập với hệ lệnh của máy  Mỗi ngôn ngữ xác định một kiểu diễn đạt kịch bản điều khiển máy tính Mỗi một kịch bản điều khiển máy viết trên một ngôn ngữ lập trình gọi là một chương trình (program) 22 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  23. NGÔN NGỮ MÁY  Chính là ngôn ngữ được viết bằng lệnh máy trong hệ nhị phân hoặc hệ 16  Ưu điểm, tận dụng được khả năng của máy, tối ưu được thời gian chạy  Nhược điểm: khó viết, khó chữa lỗi, phụ thuộc vào từng loại máy. Nói chung chi phí cao. Mã máy nhị phân Mã hexa Ý nghĩa Nạp 1060 lên TG AX 1001 0001 0110 0000 0001 0000 A1 60 10 Cộng AX với 1066 -> AX 0000 0011 0110 0110 0001 0000 03 66 10 Ghi từ AX về 2B00 1010 0011 0000 0000 0010 1011 A3 00 2B 23 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  24. HỢP NGỮ (ASSEMBLY)  Về cơ bản, mỗi lệnh hợp ngữ tương tự với một lệnh máy – nhưng dùng mã chữ nên dễ hiểu, dễ sửa.  Phải dịch ra ngôn ngữ máy (thay mã lệnh và địa chỉ)  Có các lệnh macro, cho phép thay thế hiệu quả hơn  Ưu điểm: dễ lập trình dễ sửa lỗi hơn ngôn ngữ máy  Nhược điểm: vẫn còn phức tạp và phụ thuộc vào máy Hợp ngữ Mã máy trong hệ hexa MOV AX CHIEU_DAI A1 64 10 ADD AX CHIEU_RONG 03 66 10 MOV NUA_CHU_VI AX A3 00 2B 24 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  25. DỊCH HỢP NGỮ (ASSEMBLY)  Để máy có thể chạy được thì phải dịch chương trình trên hợp ngữ thành một chương trình trên ngôn ngữ máy -> nhờ một phần mềm có tên là bộ hợp dịch (assembler)  đầu tiên bộ hợp dịch sẽ phải bố trí không gian nhớ cho các đối tượng, sau đó thay thế mã lệnh và địa chỉ bằng các mã số.  Thay thế được thực hiện với các lệnh macro, là các lệnh tương đương với nhiều lệnh.  Kết quả của bước dịch đầu tiên là tạo ra các mô đun đối tượng, là các đoạn chương trình dưới dạng nhị phân nhưng chưa có cấu trúc hoàn chỉnh để sẵn sàng chạy ngay.  Thường thực hiện một bước khác là liên kết, để kết hợp nhiều mô đun đối tượng thành một chương trình nhị phân hoàn chỉnh. Sau đó mới nạp chương trình này vào thi hành 25 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  26. NGÔN NGỮ BẬC CAO  Ngôn ngữ máy và hợp ngữ phụ thuộc vào máy, lại khó dùng, vì nó buộc người lập trình phải viết tinh tế đến mức lệnh máy.  Người ta muốn các ngôn ngữ chỉ diễn tả thuật toán mà thôi, không liên quan đến các hệ lệnh đặc thù của máy tính cụ thể. Các ngôn ngữ này gọi là ngôn ngữ bậc cao (high level language) hay còn gọi là ngôn ngữ thuật toán (algorithmic language)  Ngôn ngữ thuật toán có hình thức giống với ngôn ngữ tự nhiên hoặc ngôn ngữ toán học nên dễ diễn đạt hơn nhiều so với ngôn ngữ máy hoặc hợp ngữ 26 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  27. VÍ DỤ VỀ NGÔN NGỮ BẬC CAO  Ví dụ giải phương trình bậc 2  FORTRAN trên PASCAL DELTA = B*B - 4* A*C DELTA := B*B - 4*A*C; IF DELTA = 0 THEN X1= (- B + SQRT(DELTA))/(2*A) BEGIN X2 =(- B - SQRT(DELTA))/(2*A) X1 := (- B + SQRT(DELTA))/(2*A); WRITE (3,20) X1, X2 X2 := (- B - SQRT(DELTA))/(2*A); 20 FORMAT ('NGHIEM 1= ', F8.3, WRITE (X1,X2); NGHIEM 2 = ', F8.3) END GOTO 30 ELSE 10 WRITE(3,40) WRITE(‘Vô nghiệm) 40 FORMAT('VO NGHIEM') 30 END 27 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  28. DỊCH NGÔN NGỮ BẬC CAO Máy tính chỉ có thể thi hành trực tiếp ngôn ngữ nhị phân, do đó phải dịch bằng một cách nào đó để máy tính có thể thực hiện được. Có hai cách thực hiện: - Sử dụng một chương trình mô phỏng (phần mềm này đã ở mã nhị phân gọi là chương trình thông dịch - interpreter). Chương trình này đọc và thi hành các lệnh trong ngôn ngữ bậc cao. Do vậy chương trình thông dịch thực sự đóng vai trò một máy ảo. Trong chế độ thông dịch, không sinh chương trình tương ứng trong mã nhị phân - Dịch chương trình trong ngôn ngữ thuật toán thành một chương trình ở ngôn ngữ máy bảo toàn ngữ nghĩa nhờ chương trình biên dịch (compiler) 28 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  29. THỰC HIỆN CHƯƠNG TRÌNH TRÊN NGÔN NGỮ BẬC CAO  Soạn thảo chương trình nhờ một bộ soạn thảo nào đó  Phân tích từ vựng (lexical analys): tạo ra hồ sơ của tất cả các đối tượng của chương trình phục vụ cho việc phân phối không gian nhớ sau này  Phân tích cú pháp (syntax analys):. Cú pháp (syntax): quy tắc viết các câu lệnh (statement) đảm bảo rõ nghĩa, không nhập nhằng. Nếu không đúng sẽ không thể tạo được mã Tất cả các lỗi cú pháp đều được phát hiện được trong khi dịch.  Tạo mã, tối ưu mã (code generation, optimalization)  Liên kết: (link) kết nối các mô đun đối tượng thành một chương trình hoàn chỉnh và duy nhất.  Thực hiện, tải chương trình và nạp dữ liệu để chạy. Khi chạy vẫn còn có thể có lỗi ngữ nghĩa. Lỗi ngữ nghĩa chỉ có thể phát hiện khi chạy chương trình 29 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  30. DỊCH SANG NGÔN NGỮ MÁY Phần mềm Chương trình Chương Dữ liệu soạn thảo dịch trình liên kết Kết quả Chương trình Các mô đun Chương trình xử lý nguồn đối tượng chạy được Lỗi cú Lỗi liên kết Lỗi thi pháp hành Soạn thảo Dịch Liên kết Thực hiện 30 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  31. MÔI TRƯỜNG PHÁT TRIỂN PHẦN MỀM  1985: với sự xuất hiện bộ phát triển Turbo Pascal đã hình thành một khuynh hướng mới về việc tạo ra các môi trường phát triển tích hợp IDE (Intergated Development Environment) -> toàn bộ các quá trình soạn thảo, dịch, liên kết , thi hành và gỡ lỗi được thực hiện trong cùng một mối trường liên hệ chặt chẽ  bước phát triển tiếp của IDE là việc phát triển hướng đối tượng, phát triển theo mẫu, lập trình hướng tới thành phần (liên kết động các thành phần có sẵn trong mã nhị phân) làm việc sinh mã chương trình trở nên hiệu quả hơn rất nhiều.  Các hệ CASE (Computer Aided Software Engineering) còn cho phép phát sinh mã trên nền thiết kế là một bước tiến theo một khuynh hướng khác. 31 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  32. Tóm tắt nội dung  Ngôn ngữ lập trình là phương tiện diễn tả thuật toán để máy tính có thể sử dụng trực tiếp hoặc gián tiếp.  Theo mức trừu tượng hoá có các mức là ngôn ngữ máy, hợp ngữ và ngôn ngữ thuật toán. Đối với hợp ngữ phải sử dụng phần mềm hợp dịch, với ngôn ngữ thuật toán phải dùng phần mềm biên dịch để tạo ra phần mềm tương ứng trong ngôn ngữ máy – ngôn ngữ mà máy có thể chạy trực tiếp.  Các bước chính để dịch từ một chương trình nguồn sang mã nhị phân là soạn thảo, phân tích từ vựng, phân tích cú pháp, dịch, tối ưu hoá, liên kết mã. Trong các môi trường tích hợp các khâu trên và cả khâu gỡ lỗi được tích hợp vào trong một tổng thể. 32 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  33. THẢO LUẬN  Sự khác biệt giữa các mức ngôn ngữ lập trình, nguyên tắc phân biệt các mức của NNLT.  Đánh giá hiệu quả của các thuật toán khác nhau cùng giải quyết 1 bài toán.  Phân tích ưu, nhược điểm của từng phương pháp biểu diễn giải thuật? 33 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  34. CÂU HỎI VÀ BÀI TẬP 1. Thuật toán là gì? Cho ví dụ. 2. Xác định input và output cho các thuật toán sau đây: a. Rút gọn một phân số. b. Kiểm tra xem ba số cho trước a, b và c có thể là độ dài ba cạnh của một tam giác hay không? 3. Trình bày tính chất xác định của thuật toán và nêu rõ nghĩa của tính chất này 4. Cho tam giác ABC có góc vuông A và cho biết cạnh a và góc B. Hãy viết thuật toán để tính góc C, cạnh b và cạnh c. 5. Hãy phát biểu thuật toán để giải bài toán sau: "Có một số quả táo. Dùng cân hai đĩa (không có quả cân) để xác định quả táo nặng nhất" 6. Chỉ dùng phép cộng, tính bình phương của một số 34 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  35. CÂU HỎI VÀ BÀI TẬP 7. So sánh ngôn ngữ thuật toán với ngôn ngữ máy và hợp ngữ 8. Kể tên một số ngôn ngữ lập trình mà bạn biết 9. Nếu các bước thực hiện một chương trình trên ngôn ngữ thuật giải 10. Phân biệt lỗi cú pháp và lỗi ngữ nghĩa 11. Trình bày môi trường phát triển tích hợp 35 Giải thuật xử lý thông tin và ngôn ngữ lập trình
  36. HỎI VÀ ĐÁP Máy tính điện tử và xử lý thông tin