Bài giảng Kỹ thuật lập trình - Tuần 13: Cây (Tree) - Hà Đại Dương

pdf 21 trang cucquyet12 4100
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kỹ thuật lập trình - Tuần 13: Cây (Tree) - Hà Đại Dương", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ky_thuat_lap_trinh_tuan_13_cay_tree_ha_dai_duong.pdf

Nội dung text: Bài giảng Kỹ thuật lập trình - Tuần 13: Cây (Tree) - Hà Đại Dương

  1. 12/1/2016 Kỹ thuật lập trình Tuần 13 – Cây (Tree) Giáo viên: Hà Đại Dương duonghd@mta.edu.vn 12/1/2016 1 Nội dung • Giới thiệu khái niệm cấu trúc cây. • Cấu trúc dữ liệu cây nhị phân tìm kiếm: tổ chức, các thuật toán, ứng dụng. • Giới thiệu cấu trúc dữ liệu cây nhị phân tìm kiếm 12/1/2016 2 Cấu trúc cây 12/1/2016 3 1
  2. 12/1/2016 Định nghĩa • Cây là một tập hợp T các phần tử (gọi là nút của cây) trong đó: – Có 1 nút đặc biệt được gọi là gốc, – Các nút còn lại được chia thành những tập rời nhau T1, T2 , , Tn theo quan hệ phân cấp trong đó Ti cũng là một cây. – Mỗi nút ở cấp i sẽ quản lý một số nút ở cấp i+1. Quan hệ này người ta còn gọi là quan hệ cha-con. 12/1/2016 4 Một số khái niệm • Bậc của một nút : là số cây con của nút đó • Bậc của một cây : là bậc lớn nhất của các nút trong cây (số cây con tối đa của một nút thuộc cây ). Cây có bậc n thì gọi là cây n-phân. • Nút gốc : là nút không có nút cha. • Nút lá : là nút có bậc bằng 0 . • Nút nhánh : là nút có bậc khác 0 và không phải là gốc . 12/1/2016 5 Một số khái niệm • Mức của một nút : – Mức (gốc (T) ) = 0. – Gọi T T T Tn là các cây con của T 1, 2, 3, , 0 – Mức T Mức T Mức Tn Mức T ( 1) = ( 2) = = ( ) = ( 0) + 1. 12/1/2016 6 2
  3. 12/1/2016 Một số khái niệm • Độ dài đường đi từ gốc đến nút x : là số nhánh cần đi qua kể từ gốc đến x • Độ dài đường đi tổng của cây : PT  PX X T trong đó Px là độ dài đường đi từ gốc đến X. • Độ dài đường đi trung bình : PI = PT/n (n là số nút trên cây T). • Rừng cây: là tập hợp nhiều cây trong đó thứ tự các cây là quan trọng 12/1/2016 . 7 Ví dụ gốc Cạnh J nút Z A B R D Q K A F L Lá 12/1/2016 8 Cây nhị phân (Binary tree) 12/1/2016 9 3
  4. 12/1/2016 Định nghĩa • Cây nhị phân là cây mà mỗi nút có tối đa 2 cây con • Trong thực tế thường gặp các cấu trúc có dạng cây nhị phân. • Một cây tổng quát có thể biểu diễn thông qua cây nhị phân. 12/1/2016 10 Ví dụ Cây con Cây con trái phải Hình ảnh một cây nhị phân 12/1/2016 11 Một số tính chất • Số nút nằm ở mức i 2i • Chiều cao cây h là mức cao nhất + 1. h • Số nút lá 2 -1, với h là chiều cao của cây. • Chiều cao của cây h log số 2( nút trong cây). h • Số nút trong cây 2 -1. • Đường đi (path) – Tên các node của quá trình đi từ node gốc theo các cây con đến một node nào đó. 12/1/2016 12 4
  5. 12/1/2016 Biểu diễn cây nhị phân T • Cây nhị phân là một cấu trúc bao gồm các phần tử (nút) được kết nối với nhau theo quan hệ “cha-con” với mỗi cha có tối đa 2 con. Để biểu diễn cây nhị phân ta chọn phương pháp cấp phát liên kết. Ứng với một nút, ta sử dụng một biến động lưu trữ các thông tin sau: – Thông tin lưu trữ tại nút. – Địa chỉ nút gốc của cây con trái trong bộ nhớ. – Địa chỉ nút gốc của cây con phải trong bộ nhớ. 13 Cây nhị phân Để đơn giản, ta khai báo cấu trúc dữ liệu như sau : typedef struct NODE { int data; NODE* left; NODE* right; }; typedef struct NODE* TREE; TREE root; 14 Tạo cây nhị phân void CreateTree(TREE &root) { int x; printf(“\nGia tri node :”); x=toupper(getch()); if(isspace(x)==0) { root=(node*)malloc(sizeof(node)); root ->data=x; printf(“\nCon trai cua %c (ENTER NULL)”,x); CreateTree(root->left); printf(“\nCon phai cua %c (ENTER NULL)”,x); CreateTree(root->right); } else root=NULL; } 15 5
  6. 12/1/2016 Cây nhị phân Duyệt cây nhị phân • Có 3 kiểu duyệt chính có thể áp dụng trên cây nhị phân: – Duyệt theo thứ tự trước (NLR) – Duyệt theo thứ tự giữa (LNR) – Duyệt theo thứ tựï sau (LRN). • Tên của 3 kiểu duyệt này được đặt dựa trên trình tự của việc thăm nút gốc so với việc thăm 2 cây con. 16 Cây nhị phân Duyệt theo thứ tự trước (Node-Left-Right) • Kiểu duyệt này trước tiên thăm nút gốc sau đó thăm các nút của cây con trái rồi đến cây con phải. • Thủ tục duyệt có thể trình bày đơn giản như sau: void NLR(TREE root) { if (Root != NULL) { ;//Xử lý tương ứng theo nhu cầu NLR(root->left); NLR(root->right); } } 17 Cây nhị phân Duyệt theo thứ tự trước (Node-Left-Right) • Một ví dụ: đọc một quyển sách hay bài báo từ đầu đến cuối như minh họa trong hình bên dưới: 18 6
  7. 12/1/2016 Duyệt theo thứ tự trước (Node-Left-Right) A B C D E F G H I J K L M N O P Kết quả: A B D H I N E J O K C F L P G M 19 Cây nhị phân Duyệt theo thứ tự giữa (Left- Node-Right) • Kiểu duyệt này trước tiên thăm các nút của cây con trái sau đó thăm nút gốc rồi đến cây con phải. • Thủ tục duyệt có thể trình bày đơn giản như sau: void LNR(TREE root) { if (root != NULL) { LNR(root->left); ; //Xử lý tương ứng theo nhu cầu LNR(root->right); } } 20 Duyệt theo thứ tự giữa (Left- Node-Right) A B C D E F G H I J K L M N O P Kết quả: H D N I B J O E K A F P L C M G 21 7
  8. 12/1/2016 Cây nhị phân Duyệt theo thứ tự sau (Left-Right-Node) • Kiểu duyệt này trước tiên thăm các nút của cây con trái sau đó thăm đến cây con phải rồi cuối cùng mới thăm nút gốc. • Thủ tục duyệt có thể trình bày đơn giản như sau: void LRN(TREE root) { if (root != NULL) { LRN(root->left); LRN(root->right); ; //Xử lý tương ứng theo nhu cầu } } 22 Cây nhị phân Duyệt theo thứ tự sau (Left-Right-Node) • Một ví dụ quen thuộc trong tin học về ứng dụng của duyệt theo thứ tự sau là việc xác định tồng kích thước của một thư mục trên đĩa 23 Duyệt theo thứ tự sau (Left-Right-Node) A B C D E F G H I J K L M N O P Kết quả: H N I D O J K E B P L F M G C A 24 8
  9. 12/1/2016 Cây nhị phân Duyệt theo thứ tự sau (Left-Right-Node) • Tính toán giá trị của biểu thức dựa trên cây biểu thức (3 + 1) 3/(9 – 5 + 2) – (3 (7 – 4) + 6) = –13 25 Cây nhị phân Biểu diễn cây tổng quát bằng cây nhị phân • Nhược điểm của các cấu trúc cây tổng quát: – Bậc của các nút trên cây có thể dao động trong một biên độ lớn việc biểu diễn gặp nhiều khó khăn và lãng phí. – Việc xây dựng các thao tác trên cây tổng quát phức tạp hơn trên cây nhị phân nhiều. • Vì vậy, thường nếu không quá cần thiết phải sử dụng cây tổng quát, người ta chuyển cây tổng quát thành cây nhị phân. 26 Cây nhị phân Biểu diễn cây tổng quát bằng cây nhị phân • Ta có thể biến đổi một cây bất kỳ thành một cây nhị phân theo qui tắc sau: – Giữ lại nút con trái nhất làm nút con trái. – Các nút con còn lại chuyển thành nút con phải. – Như vậy, trong cây nhị phân mới, con trái thể hiện quan hệ cha con và con phải thể hiện quan hệ anh em trong cây tổng quát ban đầu. 27 9
  10. 12/1/2016 Cây nhị phân Biểu diễn cây tổng quát bằng cây nhị phân • Giả sử có cây tổng quát như hình bên dưới: A B C D E F G H I J 28 Cây nhị phân Biểu diễn cây tổng quát bằng cây nhị phân • Cây nhị phân tương ứng sẽ như sau A: B E C F H D G I J 29 Cây nhị phân Một cách biểu diễn cây nhị phân khác • Đôi khi, khi định nghĩa cây nhị phân, người ta quan tâm đến cả quan hệ 2 chiều cha con chứ không chỉ một chiều như định nghĩa ở phần trên. • Lúc đó, cấu trúc cây nhị phân có thể định nghĩa lại như sau: typedef struct tagTNode { DataType Key; struct tagTNode* pParent; struct tagTNode* pLeft; struct tagTNode* pRight; }TNODE; typedef TNODE *TREE; 30 10
  11. 12/1/2016 Cây nhị phân Một cách biểu diễn cây nhị phân khác 31 Cây nhị phân tìm kiếm Cây nhị phân tìm kiếm • Trong chương 3, chúng ta đã làm quen với một số cấu trúc dữ liệu động. Các cấu trúc này có sự mềm dẻo nhưng lại bị hạn chế trong việc tìm kiếm thông tin trên chúng (chỉ có thể tìm kiếm tuần tự). • Nhu cầu tìm kiếm là rất quan trọng. Vì lý do này, người ta đã đưa ra cấu trúc cây để thỏa mãn nhu cầu trên. • Tuy nhiên, nếu chỉ với cấu trúc cây nhị phân đã định nghĩa ở trên, việc tìm kiếm còn rất mơ hồ. • Cần có thêm một số ràng buộc để cấu trúc cây trở nên chặt chẽ, dễ dùng hơn. • Một cấu trúc như vậy chính là cây nhị phân tìm kiếm. 33 11
  12. 12/1/2016 Cây nhị phân tìm kiếm • Định nghĩa: cây nhị phân tìm kiếm (CNPTK) là cây nhị phân trong đó tại mỗi nút, khóa của nút đang xét lớn hơn khóa của tất cả các nút thuộc cây con trái và nhỏ hơn khóa của tất cả các nút thuộc cây con phải. • Nếu số nút trên cây là N thì chi phí tìm kiếm trung bình chỉ khoảng log N 2 . 34 Cây nhị phân tìm kiếm 44 18 88 13 37 59 108 15 23 40 55 71 35 Thêm một nút vào cây int InsertTree(tree &root , int x) { if(root != NULL) { if(root->data==x) return 0; if(root->data>x) return InsertTree(root->letf,x); else return InsertTree(root->right,x); } else { root=(node*)malloc(sizeof(node); if(root !=NULL) return -1; root->data=x; root->left=root->right=NULL; return 1; } } 36 12
  13. 12/1/2016 Tạo cây nhị phân tìm kiếm • Ta có thể tạo một cây nhị phân tìm kiếm bằng cách lặp lại quá trình thêm 1 phần tử vào một cây rỗng. void CreateTree(tree &root) { int x,n; printf(“Nhap n = “); scanf(“%d”,&n); for(int i=1; i<=n;i++) { scanf(“%d”,&x); InsertTree(root,x); } } 37 Tạo cây nhị phân tìm kiếm 25 37 10 18 29 50 3 1 6 5 12 20 35 13 32 41 25 10 37 3 18 29 50 1 6 12 20 35 41 5 13 32 25 37 10 18 29 50 3 1 6 5 12 20 35 13 32 41 38 Duyệt cây nhị phân tìm kiếm • Thao tác duyệt cây trên cây nhị phân tìm kiếm hoàn toàn giống như trên cây nhị phân. • Lưu ý: khi duyệt theo thứ tự giữa, trình tự các nút duyệt qua sẽ cho ta một dãy các nút theo thứ tự tăng dần của khóa. 39 13
  14. 12/1/2016 Tìm một phần tử x trong cây (đệ quy) • Tìm một phần tử x trong cây (đệ quy): TNODE* searchNode(TREE root, Data X) { if(root) { if(root->data == X) return root; if(root->data > X) return searchNode(root->left, X); return searchNode(root->right, X); } return NULL; } 40 Tìm một phần tử x trong cây (không đệ quy) • Tìm một phần tử x trong cây (không đệ quy): TNODE * searchNode(TREE root, Data x) { TNODE *p = root; while (p != NULL) { if(x == p->data) return p; else if(x data) p = p->left; else p = p->right; } return NULL; } 41 Tìm một phần tử x=13 trong cây 25 10 37 3 18 29 50 1 6 12 20 35 41 5 13 32 KhácGiốngNode nhau gốcnhau nhỏlớn hơnhơn Số node duyệt: 5 Tìm kiếm 13 Tìm thấy Số lần so sánh: 9 42 14
  15. 12/1/2016 Tìm một phần tử x trong cây Nhận xét: – Số lần so sánh tối đa phải thực hiện để tìm phần tử X là h, với h là chiều cao của cây. – Như vậy thao tác tìm kiếm trên CNPTK có n nút tốn chi phí trung bình khoảng O log n ( 2 ) . 43 Tìm một phần tử x trong cây 44 44 X 88 13 37 59 108 59 > X 15 23 40 55 71 44 Thêm một phần tử x vào cây • Thêm một phần tử x vào cây: – Việc thêm một phần tử X vào cây phải bảo đảm điều kiện ràng buộc của CNPTK. Ta có thể thêm vào nhiều chỗ khác nhau trên cây, nhưng nếu thêm vào một nút ngoài sẽ là tiện lợi nhất do ta có thể thực hiên quá trình tương tự thao tác tìm kiếm. Khi chấm dứt quá trình tìm kiếm cũng chính là lúc tìm được chỗ cần thêm. – Hàm insert trả về giá trị –1, 0, 1 khi không đủ bộ nhớ, gặp nút cũ hay thành công: 45 15
  16. 12/1/2016 Thêm một phần tử x vào cây int insertNode(TREE &root, Data X) { if (root) { if(root->data == X) return 0; // đã có if(root->data > X) return insertNode(root->left, X); else return insertNode(root->right, X); } root = new Node; if (root == NULL) return -1; // thiếu bộ nhớ root->data = X; root->left = root->right = NULL; return 1; // thêm vào thành công } 46 Thêm một phần tử x vào cây 44 44 X 88 13 37 59 108 59 > X 15 23 40 55 71 55 > X 50 47 Hủy một phần tử có khóa x • Việc hủy một phần tử X ra khỏi cây phải bảo đảm điều kiện ràng buộc của CNPTK. • Có 3 trường hợp khi hủy nút X có thể xảy ra: – X là nút lá. – X chỉ có 1 con (trái hoặc phải). – X có đủ cả 2 con 48 16
  17. 12/1/2016 Hủy một phần tử có khóa x Trường hợp 1: X là nút lá. 1. Xóa node này 2. Gán liên kết từ cha của nó thành rỗng 49 Hủy một phần tử có khóa x Trường hợp 1: X là nút lá. • Ví dụ : chỉ đơn giản hủy X vì nó không móc nối đến phần tử nào khác. T/h 1: huûy 44 X=40 18 88 13 37 59 108 15 23 40 55 71 50 Hủy một phần tử có khóa x Trường hợp 2: X chỉ có 1 con (trái hoặc phải) 1. Gán liên kết từ cha của nó xuống con duy nhất của nó u u 2. Xóa node này x v v 51 17
  18. 12/1/2016 Hủy một phần tử có khóa x Trường hợp 2: X chỉ có 1 con (trái hoặc phải) • Trường hợp thứ hai: trước khi hủy X ta móc nối cha của X với con duy nhất của nó T/h 2: huûy 44 X=37 18 88 13 37 59 108 15 23 55 71 52 Hủy một phần tử có khóa x Trường hợp 3: X có đủ 2 con 1. Tìm w là node trước node x trên phép duyệt cây inorder (chính là node cực phải của cây con bên trái của x) 2. Thay x bằng w 3. Xóa node w cũ (giống trường hợp 1 hoặc 2 đã xét) 53 Hủy một phần tử có khóa x Trường hợp 3: X có đủ 2 con • Trường hợp cuối cùng: – Không thể hủy trực tiếp do X có đủ 2 con – Hủy gián tiếp: • Thay vì hủy X, ta sẽ tìm một phần tử thế mạng Y. Phần tử này có tối đa một con. • Thông tin lưu tại Y sẽ được chuyển lên lưu tại X. • Sau đó, nút bị hủy thật sự sẽ là Y giống như 2 trường hợp đầu. – Vấn đề: chọn Y sao cho khi lưu Y vào vị trí của X, cây vẫn là CNPTK. 54 18
  19. 12/1/2016 Hủy một phần tử có khóa x Trường hợp 3: X có đủ 2 con • Vấn đề là phải chọn Y sao cho khi lưu Y vào vị trí của X, cây vẫn là CNPTK. • Có 2 phần tử thỏa mãn yêu cầu: – Phần tử nhỏ nhất (trái nhất) trên cây con phải. – Phần tử lớn nhất (phải nhất) trên cây con trái. • Việc chọn lựa phần tử nào là phần tử thế mạng hoàn toàn phụ thuộc vào ý thích của người lập trình. • Ở đây, ta sẽ chọn phần tử phải nhất trên cây con trái làm phân tử thế mạng. 55 Hủy một phần tử có khóa x Trường hợp 3: X có đủ 2 con • Khi hủy phần tử X=18 ra khỏi cây, phần tử 23 là phần tử thế mạng: T/h 3: huûy X=18 44 18 88 13 37 59 108 15 23 40 55 71 56 30 Hủy một phần tử có khóa x Trường hợp 3: X có đủ 2 con • Hàm delNode trả về giá trị 1, 0 khi hủy thành công hoặc không có X trong cây: int delNode(TREE &root, Data X) • Hàm searchStandFor tìm phần tử thế mạng cho nút p void searchStandFor(TREE &p, TREE &q) 57 19
  20. 12/1/2016 Hủy một phần tử có khóa x int delNode(TREE &root, Data X) { if(root== NULL) return 0; if(root->data > X) return delNode(root->left, X); if(root->data right, X); //T->Key == X Node* p = root; if(root->left == NULL) root = root->right; else if(root->right == NULL) root = root->left; else // T cĩ dủ 2 con searchStandFor(p, root->right); delete p; } 58 Hủy một phần tử có khóa x void searchStandFor(TREE &p, TREE &q) { if(q->left) searchStandFor(p, q->left); else { p->data = q->data; p = q; q = q->right; } } 59 Hủy toàn bộ cây nhị phân tìm kiếm • Việc toàn bộ cây có thể được thực hiện thông qua thao tác duyệt cây theo thứ tự sau. Nghĩa là ta sẽ hủy cây con trái, cây con phải rồi mới hủy nút gốc. void removeTree(TREE &root) { if(root) { removeTree(root->reft); removeTree(root->right); delete(root); } } 60 20
  21. 12/1/2016 Cây nhị phân tìm kiếm Nhận xét: – Tất cả các thao tác searchNode insertNode delNode đều có độ phức tạp trung, bình O h, với h là chiều cao của cây ( ), – Trong trong trường hợp tốt nhất CNPTK có n nút sẽ có độ cao h log n Chi phí tìm, kiếm khi đó sẽ tương đương tìm= kiếm2( ). nhị phân trên mảng có thứ tự. – Trong trường hợp xấu nhất, cây có thể bị suy biến thành 1 danh sách liên kết (khi mà mỗi nút đều chỉ có 1 con trừ nút lá). Lúc đó các thao tác trên sẽ có độ phức tạp O(n). – Vì vậy cần có cải tiến cấu trúc của CNPTK để đạt được chi phí cho các thao tác là log n 2( ). 61 Bài tập 12/1/2016 62 Bài tập về nhà 1. Cài đặt thử nghiệm cây nhị phân tìm kiếm 12/1/2016 63 21