B GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HC BÁCH KHOA HÀ NI
VŨ NGC DÂN
NHN DNG MU NH VI MẠNG NƠRON
LUẬN VĂN THẠC SĨ KHOA HỌC
K THUT TRUYN THÔNG
Hà Ni - Năm 2014
B GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HC BÁCH KHOA HÀ NI
VŨ NGC DÂN
NHN DNG MU NH VI MẠNG NƠRON
Chuyên ngành: K THUT TRUYN THÔNG
LUẬN VĂN THẠC SĨ KHOA HỌC
K THUT TRUYN THÔNG
NGƯỜI HƯỚNG DN KHOA HC
TS. LÊ DŨNG
Hà Ni - Năm 2014
Mục lục Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân -I-
MỤC LỤC
Mục lục ....................................................................................................................... I
Danh mục hình vẽ ..................................................................................................... V
Danh mục bảng ...................................................................................................... VII
Danh mục các tiếng anh viết tắt ......................................................................... VIII
Mở đầu ....................................................................................................................... 1
Chƣơng I: Tổng quan quá trình xử lý ảnh trong nhận dạng mẫu ảnh ................ 3
1.1. Giới thiệu chung ........................................................................................... 3
1.1.1. Xử lý ảnh và ứng dụng.............................................................................. 3
1.1.2. Các giai đoạn của quá trình nhận dạng và xử lý ảnh ................................ 3
1.1.2.1. Giai đoạn xử lý ảnh (Image processing)........................................ 3
1.1.2.2. Giai đoạn nhận dạng mẫu ảnh (Image Patten Recognition) .......... 5
1.2. Các vấn đề cơ bản trong xử lý ảnh ................................................................... 5
1.2.1. Những khái niệm liên quan ....................................................................... 5
1.2.1.1. Điểm ảnh (pixel element) ............................................................ 5
1.2.1.2. Độ phân giải của ảnh ................................................................... 6
1.2.1.3. Mức xám của ảnh (Gray level) .................................................... 6
1.2.1.4. Ảnh số .......................................................................................... 7
1.2.1.5. Các mối quan hệ cơ bản giữa các điểm ảnh ................................ 8
1.2.1.6. Biểu đồ sắc thái hình ảnh (Histogram) ........................................ 9
1.2.2. Biểu diễn ảnh ...................................................................................... 10
1.2.2.1. Biểu diễn bằng mã loạt dài ........................................................ 10
1.2.2.2. Biểu diễn bằng mã xích ............................................................. 11
1.2.2.3. Biểu diễn bằng mã tứ phân ........................................................ 11
1.2.3. Nâng cao chất lƣợng ảnh ........................................................................ 12
1.2.3.1. Nâng cao độ tƣơng phản. ............................................................ 12
1.2.3.2. Lọc nhiễu. .................................................................................. 13
1.2.4. Trích chọn đƣờng biên ............................................................................ 16
1.2.4.1. Toán tử Gradient ........................................................................ 16
Mục lục Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân -II-
1.2.4.2. Kỹ thuật Laplace ........................................................................ 19
1.2.4.3. Trích chọn đƣờng biên theo phƣơng pháp Canny ..................... 20
1.2.5. Phân vùng ảnh ..................................................................................... 22
1.2.5.1. Phân vùng dựa vào lấy ngƣỡng .................................................. 23
1.2.5.2. Phân vùng dựa vào đƣờng biên .................................................. 23
1.2.5.3. Phân vùng dựa theo miền/vùng ................................................ 24
1.2.6. Nhận dạng ảnh .................................................................................... 25
Chƣơng II: Mạng nơron ....................................................................................... 26
2.1 Gii thiu chung v mng nơ-ron ................................................................... 26
2.1.1 Mạng nơron sinh học (Biological Neural Network) ............................... 26
2.1.2 Mạng nơron nhân tạo (Artificial Neural Network) .................................. 28
2.1.2.1. Nơron nhân tạo ........................................................................... 28
2.1.2.2. Mạng nơron nhân tạo .................................................................. 28
2.1.3 Lịch s phát trin của mạng nơron nhân tạo ........................................... 30
2.1.4. Phạm vi ứng dụng của mạng nơron ........................................................ 31
2.1.4.1. Các ứng dụng của mạng nơron nhân tạo ..................................... 31
2.1.4.2. Ƣu nhƣợc điểm của mạng nơron ................................................. 32
2.2. Mô hình toán học và kiến trúc mạng nơron. .................................................. 32
2.2.1 Mô hình toán học của nơron (Neuron Model) ......................................... 32
2.2.1.1. Mô hình toán học. ....................................................................... 32
2.2.1.2. Hàm hoạt hoá .............................................................................. 34
2.2.2 Kiến trúc mạng nơron (Network Architecture) ....................................... 35
2.2.2.1. Kiến trúc mạng một lớp .............................................................. 35
2.2.2.2. Kiến trúc mạng đa lớp ................................................................ 37
2.2.2.3. Kiến trúc mạng truyền thẳng ...................................................... 37
2.2.2.4. Kiến trúc mạng hồi qui : ............................................................. 38
2.2.2.5. Kiến trúc mạng tự tổ chức : ........................................................ 39
2.2.3 Một số loại mạng nơron nhân tạo ............................................................ 41
2.3 Sử dụng mạng nơron nhân tạo ......................................................................... 41
Mục lục Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân -III-
2.3.1 Hoạt động của một mạng nơron .............................................................. 41
2.3.2 Huấn luyện mạng (Training) : ................................................................. 42
2.3.2.1.Huấn luyện đƣợc giám sát : .......................................................... 42
2.3.2.2. Huấn luyện không đƣợc giám sát ................................................ 43
2.3.3 Một số luật học ........................................................................................ 44
2.3.3.1. Luật học Hebbian ........................................................................ 44
2.3.3.2. Luật học Perceptron ..................................................................... 44
2.3.3.3. Luật học lan truyền ngƣợc (back-propagation): .......................... 45
2.3.3.4. Luật học cạnh tranh (competitive rule): ...................................... 45
2.4. Nhận dạng với mạng nơron ............................................................................ 46
2.4.1. Mạng Perceptron ..................................................................................... 46
2.4.1.1 Kiến trúc mạng ............................................................................. 46
2.4.1.2. Huấn luyện mạng ........................................................................ 47
2.4.1.3. Khả năng ứng dụng cho nhận dạng ảnh ..................................... 50
2.4.2. Mạng Perceptron đa lớp ......................................................................... 51
2.4.2.1. Kiến trúc mạng ........................................................................... 51
2.4.2.2. Huấn luyện mạng ........................................................................ 52
2.4.2.3. Khả năng ứng dụng cho nhận dạng ảnh ...................................... 58
Chƣơng III: Xây dựng chƣơng trình nhận dạng mẫu ảnh xử dụng mạng
nơron ........................................................................................................................ 60
3.1. Giới thiệu ........................................................................................................ 60
3.2. Thực hiện xây dựng chƣơng trình nhận dạng kí tự ........................................ 62
3.2.1. Xử lý dữ liệu (phân tích ảnh). ................................................................. 62
3.2.1.1. Thu nhận và tiền xử lý ảnh .......................................................... 62
3.2.1.2. Hiệu chỉnh góc nghiêng. .............................................................. 63
3.2.1.3. Tách dòng kí t ............................................................................ 64
3.2.1.4. Tách kí tự ..................................................................................... 65
3.2.1.5. Tìm giới hạn kí tự. ....................................................................... 66
3.2.2. Chuẩn hóa mẫu ảnh nhận dạng. .............................................................. 67
Mục lục Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân -IV-
3.2.3. Xây dựng mạng nơron nhận dạng kí tự .................................................. 68
3.2.3.1. Xây dựng cấu hình mạng nơron .................................................. 68
3.2.3.2. Xây dựng tập mẫu và phƣơng pháp huấn luyện mạng. ............... 70
3.2.3.3. Nhận dạng kí t ........................................................................... 72
3.3. Chƣơng trình mô phỏng và thực nghiệm........................................................ 74
3.3.1. Các chức năng của chƣơng trình. ........................................................... 74
3.3.2. Thực nghiệm. .......................................................................................... 75
3.3.2.1. Thực nghiệm quá trình tính giá trị một số tham số đầu vào ........ 75
3.3.2.2. Thực nghiệm huấn luyện mạng ................................................... 77
3.3.3. Kết quả nhận dạng. ................................................................................. 79
3.3.4. Kết luận chƣơng. ..................................................................................... 82
Kết luận: .................................................................................................................. 84
Tài liệu tham khảo: ................................................................................................ 86
Mục lục Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân -V-
DANH MỤC HÌNH VẼ
Hình 1-1. Quá trình xử lý ảnh ................................................................................... 4
Hình 1-2. Các giai đoạn chính trong xử lý ảnh .......................................................... 4
Hình 1-3. Ví dụ ảnh số 2D ........................................................................................ 6
Hình 1-4. Ví dụ về ảnh đen trắng ............................................................................... 7
Hình 1-5. Ví dụ ảnh xám ............................................................................................ 7
Hình 1-6. Ví dụ về ảnh màu ....................................................................................... 8
Hình 1-7. Lân cận của một điểm ảnh ........................................................................ 9
Hình 1-8. Minh họa biểu đồ histogram ................................................................... 10
Hình 1-9. Minh họa ảnh biểu diễn bằng mã loạt dài. .............................................. 11
Hình 1-10. Minh họa biểu diễn bằng mã xích .......................................................... 11
Hình 1-11. Ví dụ tăng độ tƣơng phản của ảnh ......................................................... 13
Hình 1-12. Ví dụ lọc nhiễu bằng bộ lọc trung vị ..................................................... 15
Hình 1-13. Sơ đồ khối lọc đồng hình ....................................................................... 16
Hình 1-14. Mặt nạ 8 hƣớng ...................................................................................... 18
Hình 1-15. Ví dụ trích chọn đƣờng biên sử dụng kỹ thuật Gradient ...................... 19
Hình 1-16. Biên ảnh theo phƣơng pháp Canny ....................................................... 22
Hình 2-1. Cấu tạo của các tế bào thần kinh sinh học(nơron) .................................. 27
Hình 2-2. Mô hình nơron nhân tạo ........................................................................... 28
Hình 2-3. Cấu hình mạng nơron nhân tạo ................................................................ 29
Hình 2-4. Mô hình toán học của nơron nhân tạo ..................................................... 33
Hình 2-5. Nơron 1 đầu vào với hàm hoạt hóa là hàm Hardlimit ............................. 34
Hình 2-6. Kiến trúc mạng 1 lớp ............................................................................... 35
Hình 2-7. Kiến trúc mạng truyền thẳng điển hình ................................................... 38
Hình 2-8. Khối trễ .................................................................................................... 38
Hình 2-9. Kiến trúc mạng hồi quy Elman ................................................................ 39
Hình 2-10. Liên kết bên ............................................................................................ 40
Hình 2-11 Kiến trúc mạng Kohonen ........................................................................ 41
Hình 2-12. Huấn luyện đƣợc giám sát ..................................................................... 43
Mục lục Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân -VI-
Hình 2-13. Kiến trúc mạng Perceptron .................................................................... 46
Hình 2-14. Biên quyết định trong không gian mẫu .................................................. 48
Hình 2-15. Không gian mẫu khả tách tuyến tính ..................................................... 49
Hình 2-16. Không gian mẫu không khả tách tuyến tính ......................................... 50
Hình 2-17. Phân tách không gian mẫu với mạng Perceptron 2 nơron lớp ra .......... 50
Hình 2-18 Mạng Perceptron đa lớp .......................................................................... 51
Hình 2-19. Mạng MLP giải quyết bài toán hàm XOR của Minsky và Papert ......... 52
Hình 2-20 Phân lớp mẫu với mạng MLP 3 lớp. ...................................................... 58
Hình 3-1. Tiến trình xử lý ảnh trƣớc khi đƣa và nhận dạng ..................................... 61
Hình 3-2. Minh họa biến đổi Hough phát hiện góc nghiêng .................................... 64
Hình 3-3 Quá trình tách dòng kí tự .......................................................................... 65
Hình 3-4. Quá trình tách kí tự .................................................................................. 66
Hình 3-5. Tìm giới hạn kí tự .................................................................................... 67
Hình 3-6. Sơ đồ mạng neural thiết kế ..................................................................... 69
Hình 3-7. Mẫu kí tự font Arial ................................................................................. 70
Hình 3-8. Mẫu kí tự font Tahoma ............................................................................ 70
Hình 3-9. Mẫu kí tự font Times new roman ............................................................ 71
Hình 3-10. Lƣu đồ quá trình huấn luyện mạng nơron ............................................. 72
Hình 3-11. Lƣu đồ nhận dạng kí tự .......................................................................... 73
Hình 3-12. Giao diện chƣơng trình nhận dạng mẫu ảnh sử ..................................... 74
Hình 3-13: Ảnh đầu vào dùng để huấn luyện ......................................................... 78
Hình 3-14. File là đầu ra mong muốn ..................................................................... 78
Hình 3-15 : Kết quả sau khi huấn luyện ................................................................... 79
Hình 3-16. nh đầu vào font Arial ............................................................................. 80
Hình 3-17. Kết quả nhận dạng mẫu ảnh font Arial .................................................. 80
Hình 3-18. nh đầu vào font Tahoma ......................................................................... 81
Hình 3-19. Kết quả nhận dạng mẫu ảnh font Tahoma ............................................. 81
Hình 3-20. nh đầu vào font Times new roman .......................................................... 81
Hình 3-21. Kết quả nhận dạng mẫu ảnh font Times new roman ............................. 82
Mục lục Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân -VII-
DANH MỤC BẢNG
Bảng 2.1. Một số hàm hoạt hóa................................................................................. 34
Bảng 3.1. Thực nghiệm tìm số lần lặp ...................................................................... 75
Bảng 3.2. Thực nghiệm tìm số kí tự .......................................................................... 76
Bảng 3.3. Thực nghiệm tìm tốc độ học ..................................................................... 77
Bảng 3.4. Thống kê kết quả huấn luyện: ................................................................... 79
Mục lục Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân -VIII-
DANH MỤC CÁC TỪ TIẾNG ANH VIẾT TẮT
STT
Từ viết tắt
Từ viết tƣờng minh
1
CCD
Charge Coupled Device
2
CGA
Color Graphic Adaptor
3
R
Red
4
G
Green
5
B
Blue
6
MIT
Massachurehs Insritute of technology
7
IJCNN
International Joint Conference out Neural Network
8
ANN
Artificial Neural Network
9
SOM
Self Organizing Neural Network
10
MLP
Multi Layer Perceptron
Mở đầu Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân - 1 -
MỞ ĐẦU
- Lý do lựa chọn đề tài:
Hiện nay, mạng Nơron đƣợc đƣa vào ng dụng rng rãi trong rt nhiu lĩnh
vc. Và bài toán nhận dng là bài toán s dụng các tính năng ca mng Nơron nhiu
nht. Bài toán nhn dng với s tr gp ca mng Nơron ngày nay đã không còn
dng mc độ nghiên cu nữa mà tr thành mt lĩnh vc đáp dụng vào thc
tế. Các bài toán nhn dng đƣợc nghiên cu nhiều nht hiện nay tập trung vào
nhn dng mẫu hình hc (vân tay, mặt ng
ƣ
i, hình khối …), nhn dng tiếng nói
nhn dng ch viết. Chúng
đƣợc
ng dng trong rất nhiu lĩnh vc
nhƣ
y học, d
báo thi tiết, d báo cháy rng, …, các lĩnh vc t động a
nhƣ
điều khiển rô-bốt,
điu khin các thiết b bng giọng nói,…. Trong s các bài toán nhn dng này,
nhận dng ch viết đang đƣợc ứng dụng rất ph biến. Nhận dng ch viết đƣợc
ứng dụng trong quá trình t động hóa các công vic văn phòng
nhƣ
nhập liu,
lƣu
trữ văn bn, ch báo, phân loi
thƣ
n,…, nhng công việc rất nhàm chán đòi
hi nhiu thời gian ca con ng
ƣ
i. Nhn dng bng mng Nơron đang đƣợc ứng
dụng trong hàng lot lĩnh vc quan trọng ca cuc sống, phc v lợi ích trc tiếp
thiết thc cho công việc ca con ng
ƣ
i. Nhận thấy đƣợc vai trò quan trọng của
mạng nơron trong nhận dạng nên tôi đã lựa chọn đề tài: Nhận dạng mẫu ảnh sử
dụng mạng nơron”.
- Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu.
Mục đích của luận văn nghiên cứu các phƣơng pháp xử ảnh, nghiên cứu
về mạng nơron để y dựng một hệ thống nhận dạng chữ viết tay để phục vụ cho
việc xem điểm tự động trƣờng Cao đẳng Công nghiệp Nam Định. Tuy nhiên do
hạn chế về mặt thời gian, cũng nhƣ độ phức tạp của bài toán khả năng lập trình
hạn trong khuôn kh, thời
lƣng
ca lun văn, tôi ch đi sâu nghiên cu
y dựng mt
chƣơng
trình phỏng nhn dng t chữ in với 3 font Arial,
Tahoma, Times new Roman sử dụng mạng nơron Perceptron đa lớp.
- Bố cục luận văn:
Luận văn đuợc trình bày trong 3 chƣơng, có phần mở đầu, phần kết luận, phần
mục lục, phần tài liệu tham khảo. Các nội dung cơ bản của luận văn đƣợc trình bày
theo cấu trúc nhƣ sau:
Mở đầu Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân - 2 -
Chƣơng 1: Tổng quan quá trình xử nh trong nhận dạng mẫu ảnh
Trình y khái quát v các vấn đề trong x lý nh các phƣơng pháp xử
ảnh nhƣ biểu diễn ảnh, nâng cao chất lƣợng ảnh, trích chọn đƣờng biên, phân vùng
ảnh và nhận dạng ảnh.
Chƣơng 2: Mng nơron
Trình y ki qt vmạng nơron nhân to, hình mạng nơron nhân to,
sử dụng mạng nơron nhân tạo, nhận dạng với mạng nơron Perceptron.
Chƣơng 3: Mô phỏng cơng trình nhận dạng mẫunh sdụng mạng ron
Trình bày khái quát về xử ảnh tự, xây dựng huấn luyện mạng nơron,
nhận dạng kí tự sử dụng mạng Perceptron đa lớp.
Trong khuôn khổ luận văn tôi đã y dựng đƣợc chƣơng trình nhận dạng chữ
viết với ba loại font : Arial, Tahoma Times new roman đạt đƣợc kết quả tốt,
nhƣng còn một số tồn tại cần đƣợc phát triển để đạt kết quả cao hơn.
- Phương pháp nghiên cứu.
Nghiên cu thuyết: thu nhn t internet, các i liu t thy hƣớng dn.
Thu thp i liu, đọc, hiu
Tng hp đánh giá, pn tích nhng vn đ v cơ s khoa hc, cơ s lun
ca lĩnh vc nghiên cu.
Nghiên cu thuyết tng hp y dựng chƣơng trình mô phỏng
Tôi xin chân thành cảm ơn Thầy giáo, TS. Dũng đã tận tình chỉ dạy,
hƣớng dẫn tôi trong suốt thời gian nghiên cứu thực hiện luận n. Tôi cũng xin
chân thành cảm ơn các Thầy, giáo Viện Điện tử - Vễn thông các Thầy,
giáo Trƣờng Đại học Bách Khoa Nội đã giảng dạy, giúp đỡ tôi trong suốt thời
gian học tập.
Xin cảm ơn các bạn , đồng nghiệp đã tạo diều kiện cũng nhƣ đã chỉ bảo tôi
rất nhiều trong thời gian thực hiện luận văn này.
Cuối cùng, xin chân thành cảm ơn gia đình đã động viên tạo mọi điều kiện
thuận lợi dể tôi có đƣợc kết quả nhƣ ngày hôm nay.
Chương 1: Tổng quan quá trình xử lý ảnh Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân - 3 -
CHƢƠNG I
TỔNG QUAN QUÁ TRÌNH XỬ LÝ ẢNH TRONG NHẬN
DẠNG MẪU ẢNH
1.1. Giới thiệu chung
1.1.1. Xử lý ảnh và ứng dụng
Xử ảnh ngành khoa học nghiên cứu các quá trính xử thông tin dạng
hình ảnh (một dạng thông tin phong phú nhất đối với con ngƣời). Xử ảnh một
trong những lĩnh vực có nhiều ứng dụng trong thực tiễn nhƣ:
- Nén hóa ảnh, xử ảnh động trong truyền hình số, truyền
thông.
- Xử lý ảnh X quang, siêu âm, ảnh cắt lớp … trong y tế.
- Xử các ảnh chụp trụ, địa hình, lập bản đồ trong không gian
trụ.
- Phân tích ảnh chụp địa hình phát hiện khoáng … trong khai khoáng.
- Kỹ xảo phim ảnh, ng cao chất lƣợng ảnh, chế bản ảnh chất lƣợng cao
…trong chế tác phim ảnh, chế bản điện tử.
- Các hệ thống nhận dạng, máy nhìn … trong hệ thống tự động và Robot.
- Mô phỏng không gian thực … trong giải trí.
1.1.2. Các giai đoạn của quá trình nhận dạng và xử lý ảnh
Nhận dạng và xử lý ảnh bao gồm hai giai đoạn chính.
1.1.2.1. Giai đoạn xử lý ảnh (Image processing)
Trong giai đoạn này, ảnh của đối tƣợng trong tự nhiên đƣợc thu lại thành ảnh
số (số hóa để u trữ xử trong y nh). Sau đó ảnh đƣợc biến đổi để nâng
cao chất lƣợng ảnh nhằm thu đƣợc nhiều thông tin hơn, có thể quan sát bằng mắt.
Quá trình xử ảnh đƣợc xem nhƣ quá trình thao tác ảnh đầu vào nhằm
cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một
ảnh “tốt hơn” hoặc một kết luận.
Chương 1: Tổng quan quá trình xử lý ảnh Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân - 4 -
Hình 1-1. Quá trình xử lý ảnh
Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một
hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trƣớc hết chúng ta xem xét các
bƣớc cần thiết trong xử lý ảnh.
Hình 1-2. Các giai đoạn chính trong xử lý ảnh
Trƣớc hết là quá trình thu nhận ảnh. Ảnh thể thu nhận qua camera.
Thƣờng ảnh thu nhận qua camera tín hiệu tƣơng tự (loại camera ống kiểu CCIR),
nhƣng cũng có thể là tín hiệu số hóa (loại CCD Charge Coupled Device).
Ngoài ra, ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor) hay ảnh,
tranh đƣợc quét trên scanner.
Tiếp theo quá trình số hóa (digitalizer) để biến đổi tín hiệu tƣơng tự sang
tín hiệu rời rạc (lấy mẫu) số hóa bằng ợng tử hóa, trƣớc khi chuyển sang giai
đoạn xử lý, phân tích hay lƣu trữ lại.
Chương 1: Tổng quan quá trình xử lý ảnh Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân - 5 -
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trƣớc hết
công việc tăng cƣờng ảnh. Do những nguyên nhân khác nhau: thể do chất
lƣợng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu ảnh thể bị suy biến.
Do vậy cần phải tăng cƣờng khôi phục ảnh để làm nổi bật một số đặc tính của
ảnh, hay làm cho ảnh gần giống với trạng thái gốc trạng thái trƣớc khi ảnh bị biến
dạng. Giai đoạn tiếp theo phát hiện các đặc tính nhƣ: biên, phân vùng ảnh, trích
chọn các đặc tính, v.v…
Cuối cùng, y theo mục đích của ứng dụng sẽ giai đoạn nhận dạng,
phân lớp hay các quyết định khác.
1.1.2.2. Giai đoạn nhận dạng mẫu ảnh (Image Patten Recognition)
Hệ thống sẽ xử lý để đƣa ra các đặc trƣng của ảnh hay các đối tƣợng trong
ảnh. Sau đó hệ thống sẽ đánh giá nội dung ảnh hoặc nhận biết các mẫu trong ảnh.
1.2. Các vấn đề cơ bản trong xử lý ảnh
1.2.1. Những khái niệm liên quan
1.2.1.1. Điểm ảnh (pixel element)
Gốc của ảnh (ảnh tự nhiên) ảnh liên tục về không gian độ sáng. Để xử
bằng y tính (số), ảnh cần phải đƣợc số hoá. Số hoá ảnh sự biến đổi gần đúng
một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian)
độ sáng (mức xám). Mỗi một điểm nhƣ vậy đƣợc biết dƣới tên gọi Pixel. Trong
khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y). Điểm ảnh (Pixel)
một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thƣớc
khoảng cách giữa các điểm ảnh đó đƣợc chọn thích hợp sao cho mắt ngƣời cảm
nhận sự liên tục về không gian mức m (hoặc màu) của ảnh sgần nhƣ ảnh
thật.
Chương 1: Tổng quan quá trình xử lý ảnh Luận văn tốt nghiệp cao học
Học viên: Vũ Ngọc Dân - 6 -
Hình 1-3. Ví dụ ảnh số 2D
1.2.1.2. Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh đƣợc ấn định trên một
ảnh số đƣợc hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải đƣợc chọn sao cho mắt
ngƣời vẫn thấy đƣợc sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo
nên một mật độ phân bổ, đó chính đphân giải đƣợc phân btheo trục x y
trong không gian hai chiều.
dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là
một lƣới điểm theo chiều ngang màn hình:320 điểm * chiều dọc:200 điểm ảnh
(320*200). ràng, cùng n hình CGA 12” ta nhận thấy mịn hơn màn hình CGA
17” độ phân giải 320*200. do: cùng một mật độ (độ phân giải) nhƣng diện tích
màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
1.2.1.3. Mức xám của ảnh (Gray level)
Ảnh xám chỉ bao gồm 2 màu: màu đen u trắng. Ngƣời ta phân mức xám
thành nhiều mức, thƣờng 16, 32, 64, 128, 256 (Mức 256 mức phổ dụng). Lý
do: trong kỹ thuật máy tính thƣờng dùng 1 byte (8 bit) để biểu diễn mức xám nên số
mức xám có thể biểu diễn đƣợc là: 2
8
=256 mức. Mỗi mức xám đƣợc biểu diễn dƣới
Ảnh số 2D
Ma trận 2 chiều các điểm ảnh