Công nghệ nhận dạng khuôn mặt 3D

By TOKEN START July 4th, 2019

Ngày nay, với sự phát triển của công nghệ, và với xu hướng 3D đang thịnh hành, thì cũng tương tự vậy, chúng ta có nhận dạng khuôn mặt 3 chiều. Và tất nhiên, nghe là biết kỹ thuật này sẽ cải thiện được độ chính xác nhờ việc phân tích được nhiều thông tin để so sánh hơn rồi. Kỹ thuật này sử dụng các cảm biến 3D để nắm bắt thông tin về hình dạng của khuôn mặt, rồi dùng các điểm nổi bật trên khuôn mặt – nơi những mô cứng và xương nhìn thấy rõ nhất như đường cong của hốc mắt, mũi và cằm — để nhận ra đối tượng. Các đặc điểm này là độc nhất đối với mỗi khuôn mặt và không thay đổi theo thời gian.

Giới Thiệu

Cách thức sử dụng độ sâu và trục của các phần trên khuôn mặt không bị ảnh hưởng bởi ánh sáng, vì thế việc nhận dạng khuôn mặt 3D có thể được sử dụng cả trong bóng tối và có thể nhận ra khuôn mặt từ nhiều góc độ khác nhau với độ chênh lệch lên tới 90 độ. Và nhờ có việc xác định khuôn mặt dựa trên hình ảnh 3 chiều, nên nhận dạng 3D có khả năng xác định 1 khuôn mặt từ nhiều góc nhìn hơn.

Số lượng các điểm dữ liệu 3 chiều khiến cho độ chính xác tăng lên đáng kể bởi sự phát triển của các bộ cảm biến tinh vi giúp nắm bắt hình ảnh chụp khuôn mặt 3D được tốt hơn. Các cảm biến hoạt động bằng cách chiếu ánh sáng có cấu trúc lên gương mặt. Hàng chục hoặc nhiều hơn nữa các bộ cảm biến hình ảnh này có thể được đặt lên trên cùng một con chip CMOS-mỗi cảm biến sẽ thu một phần khác nhau của hình ảnh. Thêm vào đó, ngày nay, các thuật toán xác định biểu cảm, giới tính, độ tuổi đã được đưa vào hệ thống.

Hiện đại thì hệ thống càng phức tạp, để có thể nhận dạng 3 chiều, ngoài việc phải sử dụng phần mềm 3D, hệ thống nhận diện này cần trải qua một loạt bước để nhận diện một đối tượng:

Nhận dạng

Việc ghi lại một hình ảnh có thể thực hiện bằng cách quét một tấm ảnh 2D sẵn có, hoặc sử dụng video để có được một hình ảnh 3D sống của đối tượng.

Liên kết

Sau khi đã ghi lại một khuôn mặt, hệ thống này sẽ tính toán vị trí, kích cỡ và tư thế của đầu. Như đã đề cập từ trước, hệ thống có thể nhận ra một khuôn mặt ở góc lệch lên tới 90 độ, trong khi với hình ảnh 2D, khuôn mặt của đối tượng phải nghiêng ít nhất là 35 độ về phía camera.

Đo đạc

Sau đó, hệ thống này sẽ đo đạc những đường cong trên khuôn mặt với độ chính xác lên tới dưới 1 milimet, rồi tạo một khuôn mẫu.

Tái hiện

Sau đó, hệ thống sẽ chuyển khuôn mẫu này thành một mã độc nhất với từng người. Với mỗi khuôn mẫu, mã này có dạng một nhóm các con số đại diện cho khuôn mặt của một đối tượng.

So sánh

Nếu như hình ảnh này có dạng 3D và cơ sở dữ liệu cũng chứa các hình ảnh 3D, thì việc đối chiếu có thể tiến hành mà không phải thực hiện bất kỳ thay đổi nào đối với hình ảnh đó. Tuy vậy, nếu như hình ảnh vẫn ở dạng 2D thì sẽ có đôi chút khó khăn hơn, bởi công nghệ 3D đem lại hình ảnh thực và sống động hơn so với một hình ảnh 2D phẳng lì, bất động. Nhưng công nghệ mới có thể giải quyết được khó khăn này.

Ví dụ, phần bên ngoài và bên trong của con mắt cùng với phần đỉnh mũi sẽ được lấy ra đo đạc. Sau khi việc đo đạc này hoàn tất, một thuật toán sẽ được áp dụng để chuyển hình ảnh trong cơ sở dữ liệu sang dạng 2D. Sau khi chuyển đổi, phần mềm sẽ so sánh hai hình ảnh 2D này với nhau để tìm ra đối tượng.

Xác minh hay nhận diện

Xác minh có nghĩa là một hình ảnh sẽ được đối chiếu với chỉ 1 hình ảnh trong cơ sở dữ liệu (tỉ lệ 1:1). Ví dụ như, một hình ảnh của một đối tượng nào đó sẽ được đối chiếu với một hình ảnh trong cơ sở dữ liệu của Uỷ ban phương tiện giao thông để xác minh xem đối tượng đó là ai.

Còn nhận diện có nghĩa là một hình ảnh sẽ được đối chiếu với tất cả các hình ảnh trong cơ sở dữ liệu để tìm ra đối tượng (tỉ lệ 1:N). Khi đó, bạn phải ghi lại hình ảnh đối tượng và so sánh với toàn bộ cơ sở dữ liệu để biết được đối tượng đó là ai.

Tuy nhiên, ngay cả một kỹ thuật 3D hoàn hảo cũng có thể gặp khó khăn bởi các sắc thái biểu cảm trên gương mặt, bởi vì nó có thể gây sai lệch cho sự đo đạc cũng như xác định vị trí các điểm cần thiết cho nhận diện.

Nâng cao: Phân tích kết cấu da

Một xu hướng khác mới nổi lên đó là kỹ thuật phân tích kết cấu da. Quá trình này được gọi là Phân tích cấu trúc bề mặt, cũng hoạt động giống như hệ thống nhận diện khuôn mặt. Đầu tiên, đưa các đường đặc trưng, hình dạng, và các điểm nốt trên làn da của một người vào một không gian toán học. Một mảng da, gọi là dấu da (SkinPrint), sẽ được chụp thành hình ảnh.

Sau đó, mảng da này được chia nhỏ ra thành nhiều khối. Bằng cách sử dụng thuật toán để chuyển mảng da thành một không gian toán học có thể đo đạc được, công nghệ này sau đó sẽ phân biệt từng đường nét, từng lỗ chân lông, và cấu trúc thực của bề mặt da. Điều này giúp phân biệt được cả một cặp song sinh giống hệt nhau mà một mình phần mềm nhận dạng khuôn mặt không thể thực hiện được. Các thử nghiệm đã chỉ ra rằng, bằng cách kết hợp công nghệ nhận dạng khuôn mặt với công nghệ phân tích cấu trúc da, độ chính xác có thể tăng thêm từ 20 đến 25%.