Hog Là Gì

  -  
1. Giới thiệu về thuật toán thù HOG

1.1. Giới thiệu chung

Có rất nhiều các phương pháp khác biệt trong computer vision. khi phân các loại hình họa, chúng ta cũng có thể áp dụng chúng ta những quy mô CNN (Inception Net, mobile Net, Resnet, Dense Net, Alexnet, Unet,…) với lúc phạt hiện nay đồ vật thể là những mô hình YOLO, SSD, Faster RCNN, Fast RCNN, Mask RCNN.

Bạn đang xem: Hog là gì

Các thuật toán thù đề cập trên những là số đông mô hình deep learning. Vậy trước lúc deep learning bùng nổ, thuật toán làm sao thường xuyên được thực hiện trong giải pháp xử lý ảnh? Bài bây giờ bọn họ đang tìm kiếm hểu về thuật toán tuy truyền thống mà lại cũng rất kết quả trong giải pháp xử lý ảnh, kia đó là HOG (histogram of oriented gradient).

Thuật toán này sẽ tạo ra các bộ biểu lộ đặc thù (feature descriptor) nhằm mục đích phạt hiện tại thiết bị thể (object detection). Từ một bức ảnh, ta đang lấy ra 2 ma trận đặc trưng góp giữ ban bố hình họa chính là độ phệ gradient (gradient magnitute) với pmùi hương của gradient (gradient orientation). Bằng bí quyết phối hợp 2 đọc tin này vào một trong những biểu đồ gia dụng phân păn năn histogram, trong các số ấy độ béo gradient được đếm theo những đội bins của pmùi hương gradient. Cuối cùng ta đã chiếm được véc tơ đặc thù HOG đại diện thay mặt mang đến histogram. Sơ knhì là vậy, bên trên thực tế thuật toán thù còn chuyển động phức hợp hơn khi véc tơ HOG sẽ tiến hành tính bên trên từng vùng nỗ lực cỗ nlỗi mạng CNN cùng sau đó là phnghiền chuẩn chỉnh hóa vậy cỗ để đồng bộ độ đo. Cuối cùng véc tơ HOG tổng hợp trường đoản cú các véc tơ bên trên vùng tổng thể.

Trên đây là toàn thể giải thích vắn tắt về nguyên lý hoạt động vui chơi của HOG. cũng có thể vẫn khá khó gọi cùng với bạn đọc lúc đầu tuy thế chớ lo lắng. Chúng ta đang phân biệt sau khoản thời gian đọc cmùi hương 2 phân tích và lý giải chi tiết về thuật toán thù HOG.

1.2. Ứng dụng của HOG

Vậy HOG bao gồm áp dụng rõ ràng như thế nào? Một số tác vụ đang áp dụng HOG cùng mang đến độ chuẩn chỉnh xác cao hoàn toàn có thể kể tới là:

Nhận diện khuôn khía cạnh (face detection): Thường họ đang nghĩ về ngay cho thuật toán thù Haar Cascde Classifier. Tuy nhiên HOG cũng là một thuật toán khôn cùng hiệu quả được vận dụng vào bài bác tân oán này. Bởi nó có khả năng biểu diễn những mặt đường đường nét chủ yếu của khuôn phương diện dựa vào pmùi hương cùng độ phệ gradient trải qua những véc tơ bên trên mỗi cell nhỏng hình diễn đạt mặt dưới:

*

Nhận diện những đồ vật thể khác: Bên cạnh đó còn tương đối nhiều những trường đúng theo nhận diện đồ thể bên trên hình ảnh tĩnh nlỗi phương tiện, biểu đạt giao thông, động vật hoang dã hoặc thậm chỉ với hình ảnh hễ tự đoạn Clip.

Tạo feature cho các bài xích toán thù phân một số loại ảnh: hầu hết bài toán thù phân một số loại hình họa được tạo ra trên một cỗ tài liệu size nhỏ tuổi thì thực hiện những mạng học tập sâu không chắc hẳn vẫn đem lại tác dụng cùng dễ dẫn đến overfiting. Ngulặng nhân do tài liệu ít thường xuyên cảm thấy không được nhằm đào tạo mang lại máy tính xách tay thừa nhận tốt các đặc trưng của đồ gia dụng thể. Khi kia thực hiện HOG để tạo ra đặc thù đang mang về hiệu quả xuất sắc rộng. Cụ thể tôi cũng trở nên triển khai một ví dụ ngơi nghỉ cuối.

1.3. Thuật ngữ

Trước Khi tìm hiểu thuật toán thù HOG, tôi sẽ giải thích trước các thuật ngữ được sử dụng:

Feature Descriptor: Sở mô tả đặc trưng, là 1 trong những phxay biến hóa dữ liệu thành các đặc trưng giúp ích cho phân nhiều loại hoặc dìm diện vật dụng thể. Các cách thức hoàn toàn có thể nói tới nlỗi HOG, SUFT, SHIFT.

Gradient: Là đạo hàm của véc tơ cường độ Color giúp phát hiện tại phía dịch chuyển của các thứ thể trong hình hình ảnh.

Xem thêm: Phương pháp nuôi lô kép nuôi khung 3 ngày rồng bạch kim cực chuẩn

Local cell: Ô toàn cục. Trong thuật toán thù HOG, một hình hình ảnh được phân thành nhiều cells vị một lưới ô vuông. Mỗi cell được Call là 1 trong ô toàn bộ.

Local portion: Vùng tổng thể. Là một vùng trước trích suất ra từ bỏ ô vuông trên hình hình ảnh. Trong phần trình bày về thuật toán thì vùng cục bộ còn gọi là bloông chồng.

Local normalization: Phxay chuẩn chỉnh hóa được tiến hành bên trên một vùng toàn cục. Thường là phân chia mang lại norm chuẩn chỉnh bậc 2 hoặc norm chuẩn chỉnh bậc 1. Mục đích của câu hỏi chuẩn chỉnh hóa là để đồng hóa các giá trị cường độ màu sắc về thông thường một phân pân hận. Ta sẽ hiểu rõ hơn trong phần trình diễn thuật toán thù.

gradient direction: Phương thơm gradient. Là độ béo góc giữa véc tơ gradient $x$ với $y$ giúp khẳng định pmùi hương đổi khác độ mạnh màu sắc tuyệt đó là pmùi hương đổ bóng của hình ảnh. Giả sử $G_x, G_y$ thứu tự là quý hiếm gradient theo theo thứ tự phương $x$ và $y$ của hình ảnh. Khi đó pmùi hương gradient được tính nhỏng sau:

< heta = extacrtan(fracG_yG_x)> gradient magnitude: Độ Khủng gradient. Là chiều nhiều năm của véc tơ gradient theo pmùi hương $x$ với pmùi hương $y$. Biểu diễn phân pân hận histogram của véc tơ này theo véc tơ phương thơm gradient vẫn chiếm được véc tơ bộc lộ đặc trưng HOG. Độ lớn gradient được tính nhỏng sau:<|G| = sqrtG_x^2+G_y^2>2. Lý tmáu về HOG

Điểm cốt yếu vào nguyên tắc hoạt động vui chơi của HOG chính là làm nên của một đồ thể toàn thể rất có thể được biểu thị trải qua nhị ma trận sẽ là ma trận độ phệ gradient (gradient magnitude) cùng ma trận phương gradient (gradient direction). Vậy 2 ma trận gradient trên được tạo nên như thế nào? trước hết hình ảnh được chia thành 1 lưới ô vuông cùng trên đó họ xác minh không hề ít những vùng cục bộ gần cạnh hoặc chồng lấn lên nhau. Các vùng này tựa như như những vùng hình ảnh toàn cục nhưng bọn họ tính tích chập trong thuật toán thù CNN. Một vùng tổng thể bao hàm những ô toàn thể (vào thuật toán thù HOG là 4) tất cả size là 8x8 pixels. Sau kia, một biểu đồ dùng histogram những thống kê độ mập gradient được tính toán thù trên mỗi ô cục bộ mà lại họ đã khám phá ở phần 2.một cách thức tính. Bộ biểu lộ HOG (HOG descriptor) được sinh sản thành bằng phương pháp gắn sát (concatenate) 4 véc tơ histogram ứng cùng với mỗi ô thành một véc tơ tổng đúng theo. Để cải thiện độ đúng chuẩn, mỗi quý hiếm của véc tơ histogram trên vùng tổng thể sẽ được chuẩn hóa theo norm chuẩn bậc 2 hoặc bậc 1 (cụ thể rộng sẽ lý giải mục 2.1 bên dưới). Phép chuẩn hóa này nhằm mục tiêu làm ra bất biến giỏi hơn so với các thay đổi trong phát sáng và đổ nhẵn.

Bộ diễn đạt HOG có một vài ba điểm mạnh bao gồm so với các cỗ biểu lộ khác. Vì nó hoạt động trên các ô toàn bộ, nó bất biến so với những phnghiền biến đổi hình học, biến hóa độ sáng. mà còn, nhỏng Dalal và Triggs sẽ phát hiển thị, lúc áp dụng phnghiền chuẩn chỉnh hóa trên vùng toàn cục vẫn chất nhận được vận động cơ thể của fan quốc bộ được sa thải miễn là chúng ta gia hạn được bốn nỗ lực đứng thẳng. Do kia, bộ diễn tả HOG đặc biệt cân xứng để phát hiện nay bé tín đồ vào hình ảnh.

2.1. Thuật toán thù HOG

2.1.1. Tính toán thù gradient

Trong hầu hết các thuật toán thù xử trí hình ảnh, bước thứ nhất là chi phí cách xử lý tài liệu hình ảnh (pre-processing image). Chúng ta đã phải chuẩn chỉnh hóa Color và giá trị gamma. Tuy nhiên, đoạn này có thể được bỏ lỡ trong phần tính toán cỗ biểu thị HOG, vày việc chuẩn chỉnh hóa cỗ miêu tả ngơi nghỉ bước tiếp sau đã đạt được kết quả giống như. Ttuyệt vào kia, trên bước trước tiên của tính toán thù bộ miêu tả bọn họ công thêm các giá trị gradient. Pmùi hương pháp thông dụng duy nhất là vận dụng một khía cạnh nạ đạo hàm rời rộc (discrete derivative sầu mask) theo một hoặc cả hai chiều ngang cùng dọc. Cụ thể, phương pháp vẫn thanh lọc ma trận cường độ hình ảnh cùng với các cỗ lọc như Sobel mask hoặc scharr.

Xem thêm: Thứ 6 Ngày 13: Xuất Hiện Tựa Game Thứ 6 Ngày 13 Th: The Game 1

Để tính bộ lọc sobel, phxay tích chập của kernel size $3x3$ được triển khai với hình hình họa ban sơ. Nếu họ kí hiệu $mathbfI$ là ma trận ảnh nơi bắt đầu và $G_x, G_y$ là 2 ma trận hình ảnh mà từng điểm trên nó lần lượt là đạo hàm theo trục $x$ trục $y$. Chúng ta hoàn toàn có thể tính tân oán được kernel nlỗi sau:

Đạo hàm theo hướng ngang: Đạo hàm theo chiều dọc:

Kí hiệu * tương tự như nhỏng phép tích chập giữa bộ thanh lọc bên trái cùng hình ảnh nguồn vào bên cần.

Gía trị độ bự gradient (gradient magnitude) với phương gradient (gradient direction) hoàn toàn có thể được tạo ra từ 2 đạo hàm $G_x$ cùng $G_y$ theo công thức mặt dưới:

Độ béo gradient Phương thơm gradient:< heta = extacrtan(fracG_yG_x)>

Lúc Này, gradient được xem khá dễ dàng bên trên thư viện sklearn hoặc OpenCV: