Top Banner
LUẬN VĂN TỐT NGHIỆP THẠC SĨ BỘ GIÁO DỤC VÀ ĐÀO TẠO CỘNG HÒA XÃ HÔI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI -------------------------------- ------------------ Độc lập - Tự do - Hạnh phúc ------------------------------ --- NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Họ và tên sinh viên: Trần Quang Chiến.……………. MSHV: CB120613 Khoá: 2012B……...Viện: Điện tử - Viễn thông Ngành: Điện tử - Viễn thông 1. Đầu đề đồ án: ……………………………………………….. …………………………………………………………………………………………………………………………………………………………….. 2. Các số liệu và dữ liệu ban đầu: ……………………………………..……………………………………………..……..…………… ……………………………………………………………………………………………………………………………….…..……………………….. …………………………… 3. Nội dung các phần thuyết minh và tính toán: ………………………………………………………………………………………………………………..…. ……………………………………………………………………………………………………………………………………..….………………………… 4. Các bản vẽ, đồ thị ( ghi rõ các loại và kích thước bản vẽ ): …………………………………………………………………………………………………………………..……..…. …………………………………………………………………………………………………………………………..……….…………… 5. Họ tên giảng viên hướng dẫn: TS. NGÔ VŨ ĐỨC 6. Ngày giao nhiệm vụ đồ án: ………………………………………………….……… 7. Ngày hoàn thành đồ án: ……………………………………………………………. Ngày tháng năm Chủ nhiệm Bộ môn Giảng viên hướng dẫn Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 1
117

Luận văn TN

Mar 26, 2023

Download

Documents

Duong Le
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

BỘ GIÁO DỤC VÀ ĐÀO TẠO CỘNG HÒA XÃ HÔI CHỦ NGHĨA VIỆT NAM

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

--------------------------------

------------------

Độc lập - Tự do - Hạnh phúc

------------------------------

---

NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP

Họ và tên sinh viên: Trần Quang Chiến.……………. MSHV:

CB120613

Khoá: 2012B……...Viện: Điện tử - Viễn thông

Ngành: Điện tử - Viễn

thông1. Đầu đề đồ án:………………………………………………..……………………………………………………………………………………………………………………………………………………………..2. Các số liệu và dữ liệu ban đầu:……………………………………..……………………………………………..……..…………………………………………………………………………………………………………………………………………….…..………………………..……………………………3. Nội dung các phần thuyết minh và tính toán:………………………………………………………………………………………………………………..….……………………………………………………………………………………………………………………………………..….…………………………4. Các bản vẽ, đồ thị ( ghi rõ các loại và kích thước bản vẽ ):…………………………………………………………………………………………………………………..……..….…………………………………………………………………………………………………………………………..……….……………5. Họ tên giảng viên hướng dẫn: TS. NGÔ VŨ ĐỨC

6. Ngày giao nhiệm vụ đồ án: ………………………………………………….………7. Ngày hoàn thành đồ án: …………………………………………………………….

Ngày tháng năm

Chủ nhiệm Bộ môn Giảng viên hướng dẫn

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 1

Page 2: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Sinh viên đã hoàn thành và nộp đồ án tốt nghiệp ngày

tháng năm

Cán bộ phản biện

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 2

Page 3: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

---------------------------------------------------

BẢN NHẬN XÉT ĐỒ ÁN TỐT NGHIỆP

Họ và tên sinh viên: Trần Quang Chiến……………. MSHV:

CB120613

Khoá: 2012B………..Viện: Điện tử - Viễn thông … Ngành: Điện

tử viễn thông

Giảng viên hướng dẫn: TS. NGÔ VŨ ĐỨC

Cán bộ phản

biện: ........................................................................................................................................................

1. Nội dung thiết kế tốt nghiệp:............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

2. Nhận xét của cán bộ phản biện:......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 3

Page 4: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

.................................................................................

................................................................................

Ngày tháng

năm

Cán bộ phản biện

( Ký, ghi rõ họ và tên )

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 4

Page 5: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

LỜI NÓI ĐẦUĐể có thể đi sâu vào nghiên cứu chuẩn nén

H.265/HEVC, thì chúng ta cần nắm được các thuật ngữ, các

kỹ thuật cần thiết cho việc nén tín hiệu, cũng như là

các ưu nhược điểm của các chuẩn nén trước đó đã mang

lại.Vì đây là một đề tài lý thuyết, nên bước quan trọng

nhất của quá trình làm Đồ án tốt nghiệp là tìm kiếm tài

liệu và tổng hợp nó thành một chuỗi các kiến thức liên

tục tránh lang man và yếu tố thuyết phục người tham khảo

cũng rất quan trọng, do đó bên cạnh trình bày chi tiết

về cách thức nén, em đã cố gắng mô phỏng một phần ưu

điểm của chuẩn nén này nhằm góp phần sinh động cho đề

tài.

TỔ CHỨC ĐỒ ÁN

Đồ án được trình bày thành 6 chương và 1 phụ lục.

Chương I: Trình bày cơ sở về nén tín hiệu video, các

thông số đặc trưng của tín hiệu số và quá trình biến đổi

tín hiệu màu, phân loại các nguyên lý nén.

Chương II: Trình bày các kỹ thuật được sử dụng trong nén

Video, các phép biến đổi và các kỹ thuật mã hóa, các

tiêu chuẩn đáng giá chất lượng ảnh nén MSE, PSNR,

MAE,SAE …

Chương III: Trình bày các chuẩn nén thuộc họ MPEG, cấu

trúc dòng bit, các ưu điểm đã đạt được.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 5

Page 6: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Chương IV: Trình bày chuẩn nén tiên tiến nhất hiện nay:

H.265/HEVC, các đặc tính nổi bật và các kỹ thuật mới

trong chuẩn nén này.

Chương V: Nêu lên những điểm tối ưu của chuẩn H.265/HEVC

so với chuẩn MPEG-4 H.264/AVC.

Chương VI: Mô phỏng để thấy rõ sự khác biệt giữa HEVC và

H.264/AVC

Tuy nhiên, do kinh nghiệm còn hạn chế, đồng thời

H.265/HEVC là một kỹ thuật còn trong giai đoạn nghiên

cứu và phát triển, nên chắc chắn luận văn sẽ không tránh

khỏi sai sót, kính mong Quý Thầy Cô, và bạn bè đồng

nghiệp đóng góp ý kiến nhằm hoàn thiện tốt luận văn tốt

nghiệp này.

Học viên thực hiện: Trần Quang Chiến

TÓM TẮT ĐỒ ÁN

“ Nghiên cứu hoạt động và ứng dụng của chuẩn H.265”

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 6

Page 7: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

ABSTRACT

“ Reseach operations and applications of H.265 ”

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 7

Page 8: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

MỤC LỤC

NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP...............................................1

BẢN NHẬN XÉT ĐỒ ÁN TỐT NGHIỆP...........................................2

LỜI NÓI ĐẦU.............................................................3

TỔ CHỨC ĐỒ ÁN...........................................................3

TÓM TẮT ĐỒ ÁN...........................................................4

ABSTRACT................................................................5

DANH MỤC HÌNH VẼ........................................................8

DANH MỤC BẢNG BIỂU......................................................9

CÁC THUẬT NGỮ VIẾT TẮT.................................................10

Chương 1. Cơ sở về nén tín hiệu Video..................................121.1 Sự cần thiết của nén tín hiệu......................................................................................................12

1.2 Quá trính số hóa tín hiệu............................................................................................................131.2.1 Lấy mẫu......................................................131.2.2 Lượng tử hóa.................................................131.2.3 Mã hóa.......................................................15

1.3 Tốc độ bít và thông lượng kênh truyền tín hiệu số..................................................................151.3.1 Tốc độ bit...................................................151.3.2 Thông lượng kênh truyền tín hiệu số..........................15

1.4 Quá trình biến đổi tín hiệu màu................................................................................................16

1.5 Các tiêu chuẩn lấy mẫu video tín hiệu số.................................................................................17

1.6 Mô hình nén tín hiệu Video........................................................................................................181.6.1 Nén tín hiệu Video...........................................191.6.2 Lượng tin trung bình.........................................19

Chương 2. Các kĩ thuật nén Video.......................................222.1 Phân loại kĩ thuật nén................................................................................................................. 22

2.2 Quá trình biến đổi....................................................................................................................... 222.2.1 Điều xung mã vi sai DPCM....................................232.2.2 Mã hóa biến đổi..............................................23

2.3 Quá trình lượng tử...................................................................................................................... 252.3.1 Lượng tử vô hướng............................................252.3.2 Lượng tử vector..............................................26

2.4 Quá trình mã hóa........................................................................................................................ 272.4.1 Mã hóa độ dài thay đổi.......................................27

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 8

Page 9: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

2.4.2 Mã hóa số học................................................292.5 Tiêu chuẩn đánh giá chất lượng ảnh nén.................................................................................31

Chương 3. Các chuẩn nén thuộc họ MPEC trước H.265/HEVC.................333.1 Giới thiệu về lịch sử phát triển của chuẩn MPEG.....................................................................33

3.2 Các tiêu chuẩn nén trước H.265/HEVC......................................................................................333.2.1 Tiêu chuẩn MPEC-1............................................333.2.2 Tiêu chuẩn MPEG-2............................................363.2.3 Tiêu chuẩn MPEC-4............................................383.2.4 Tiêu chuẩn H.264.............................................39

Chương 4. Chuẩn nén H.265/HEVC.........................................444.1 Tổng quan về chuẩn nén H.265/HEVC.......................................................................................444.1.1 Lịch sử phát triển của chuẩn nén H.265/HEVC..................444.1.2 Lịch trình triển khai và các sản phẩm liên quan..............444.1.3 Các profiles và levels của chuẩn HEVC........................50

4.2 Kĩ thuật nén video HEVC............................................................................................................. 524.2.1 Giải thích hoạt động cơ bản..................................524.2.2 Cấu trúc Mã hóa (Coding Structure)...........................55

Chương 5. Những điểm tối ưu của HEVC so với H.264/AVC..................605.1 Sự tối ưu trên lý thuyết............................................................................................................... 60

5.2 Sự khác biệt qua mô phỏng với hình ảnh cụ thể.....................................................................625.2.1 Trong H.264/AVC..............................................635.2.2 Trong HEVC...................................................655.2.3 So sánh HEVC và H.264/AVC....................................69

TÀI LIỆU THAM KHẢO.....................................................73

BẢNG ĐỐI CHIẾU THUẬT NGỮ VIỆT – ANH....................................75

PHỤ LỤC................................................................79

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 9

Page 10: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

DANH MỤC HÌNH VẼHình 1-1 Sơ đồ quá trình tạo tín hiệu số..............14Hình 1-2 Quá trình biến đổi tín hiệu màu..............16Hình 1-3 Các tiêu chuẩn lấy mẫu phổ biến..............18Hình 1-4 Sơ đồ khối nén tín hiệu video................18Hình 2-1 Mô hình hệ thống nén tổn hao.................23Hình 2-2 Bộ mã hóa và giải mã DPCM....................23Hình 2-3 Quá trình lượng tử vector....................26Hình 2-4 Cây mã Huffman...............................27Hình 2-5 Minh họa mã hóa RLC..........................28Hình 2-6 Minh họa sự sắp xếp trong khoảng [0-1] thành những vùng nhỏ hơn sau mỗi ký hiệu được mã hóa.......30Hình 3-1 Quá trình phát triển của kĩ thuật nén MPEG qua các giai đoạn.........................................33

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 10

Page 11: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

DANH MỤC BẢNG BIỂU

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 11

Page 12: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

CÁC THUẬT NGỮ VIẾT TẮT

STTTừ viết

tắtThuật ngữ tiếng Anh

Thuật ngữ tiếng

Việt1 IP Internet Protocol Giao thức Internet

2 TCPTransmission

Control Protocol

Giao thức điều

khiển truyền vận

3 JPEGJoint Photographic

Experts Group4 MJPEG Motion JPEG Ảnh JPEG động5 SOF Start Of Frame Bắt đầu khung6 EOF End Of Frame Kết thúc khung

7 MACMedium Access

Control

Điều khiển truy

nhập môi trường

8 ROM Read Only MemoryBộ nhớ chỉ có thể

đọc

9 RAMRamdom Access

Memory

Bộ nhớ truy cập

ngẫu nhiên

10 SDRAMSynchronous Dynamic

RAMRAM động đồng bộ

11 MMUMemory Management

UnitKhối quản lý bộ nhớ

12 IPCInter-Process

Communication

Giao tiếp tiến

trình nội13 USB Universal Serial Kênh truyền nối

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 12

Page 13: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Bus tiếp phổ biến

14 MCUMicrocontroller

UnitKhối vi điều khiển

15 ADCAnalog- Digital

Converter

Bộ chuyển đổ tương

tự- số

16  COMComponent Object

Model

Mô hình đối tượng

thành phần

17  EDKEmbedded

Development Kit

Kit phát triển

nhúng

18 IIC hay

I2C

Inter-Intergrated

Circuit Mạch liên tích hợp 

19 PC  Personal Computer Máy tính cá nhân20 RX  Receive Data Nhận dữ liệu22 TX  Transmit Data Truyền dữ liệu23 LAN Local Area Network Mạng cục bộ

24 TFTPTrivial File

Transfer Protocol

Giao thức truyền

tệp tin đơn giản

25 DHCP

Dynamic Host

Configuration

Protocol

Giao thức cấu hình

động máy chủ

26 SSH Secure Shell Lớp vỏ bảo mật

27 NFS Network File SystemHệ thống tệp tin

trên mạng

28 GNUGeneral Public

License

Giấy phép phần mềm

tự do phổ biến29  IC Integrated Circuit Mạch tích hợp 

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 13

Page 14: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

30  ASCII

American Standard

Code for

Information

Interchange

Bảng mã chuẩn

31 UART

Universal

Asynchronous

Receiver

Transmitter

Bộ truyền nhận

không đồng bộ phổ

biến 

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 14

Page 15: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Chương 1. Cơ sở về nén tín hiệu

Video

1.1 Sự cần thiết của nén tín hiệu

Một tín hiệu video số thường chứa một lượng lớn dữ

liệu, do đó sẽ gặp rất nhiều khó khăn trong việc lưu trữ

và truyền đi trong một băng thông kênh truyền hạn chế.

Với sự phát triển của khoa học kỹ thuật, ngày nay đã sản

xuất được bộ cảm biến màu có độ phân giải lên đến 16

triệu pixel tương đương với một bức ảnh có độ phân giải

4096x4096 pixels, nhưng thực tế ứng dụng cần độ phân

giải cao nhất hiện nay cũng chỉ dùng lại ở 1920x1080

pixel, do đó để có thể tiết kiệm không gian lưu trữ và

băng thông kênh truyền thì cần nén tín hiệu.

Quá trình nén ảnh thực hiện được là do thông tin trong

bức ảnh có tổ chức, có trật tự, vì vậy nếu xem xét kỹ

tính trật tự, cấu trúc ảnh sẽ phát hiện và loại bỏ được

các lượng thông tin dư thừa, chỉ giữa lại các thông tin

quan trọng nhằm giảm số lượng bit khi lưu trữ cũng như

khi truyền mà vẫn đảm bảo tính thẩm mỹ của bức ảnh. Tại

đầu thu, bộ giải mã sẽ tổ chức, sắp xếp lại được bức ảnh

xấp xỉ gần chính xác so với ảnh gốc nhưng vẫn đảm bảo

thông tin cần thiết. Tín hiệu video thường chứa đựng một

lượng lớn các thông tin dư thừa, chúng thường được chia

thành 5 loại như sau:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 15

Page 16: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Có sự dư thừa thông tin về không gian: giữa các

điểm ảnh lân cận trong phạm vi một bức ảnh hay một

khung video, còn gọi là thừa tĩnh bên trong từng

frame.

Có sự dư thừa thông tin về thời gian: giữa các điểm

ảnh của các khung video trong chuỗi ảnh video, còn

gọi là thừa động giữa các frame

Có sự dư thừa thông tin về phổ: giữa các mẫu của

các dữ liệu thu được từ các bộ cảm biến trong

camera, máy quay…

Có sự dư thừa do thống kê: do bản thân của các ký

hiệu xuất hiện trong dòng bit với các xác suất xuất

hiện không đồng đều.

Có sự dư thừa tâm thị giác: thông tin không phù hợp

với hệ thống thị giác con người, những tần số quá

cao so với cảm nhận của mắt người.

Ưu điểm của việc nén tín hiệu:

Tiết kiệm băng thông kênh truyền ( trong thời gian

thực hoặc nhanh hơn).

Kéo dài thời giản sử dụng của thiết bị lưu trữ,

giảm chi phí đầu tư cho thiết bị lưu trữ.

Giảm dung lượng thông tin mà không làm mất tính

trung thực của hình ảnh.

Có nhiều phương pháp nén tín hiệu, phương pháp nén bằng

cách số hóa tín hiệu vẫn tỏ ra hữu hiệu trong mọi thời

đại, một mặt nó có thể làm giảm lượng thông tin không

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 16

Page 17: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

quan trọng một cách đáng kể, mặt khác nó còn giúp cho

tín hiệu được bảo mật hơn.

1.2 Quá trính số hóa tín hiệu

Quá trình số hoá tín hiệu tương tự, bao gồm quá

trình lọc trước (prefiltering), lấy mẫu, lượng tử và mã

hoá minh họa như hình I.1. Quá trình lọc trước nhằm loại

bỏ các tần số không cần thiết ở tín hiệu cũng như nhiễu,

bộ lọc này còn gọi là bộ lọc chống nhiễu xuyên kênh

Aliasing.

1.2.1 Lấy mẫu

Thực chất đây là một phép toán rời rạc hay là một

phép điều biên xung PAM và được thực hiện bằng các mạch

Op-amp có cực khiển strobe. Nó tạo ra giá trị tín hiệu

tương tự tại một số hữu hạn các giá trị có biến rời rạc

gọi là các mẫu. Các mẫu được lấy cách đều nhau gọi là

chu kỳ lấy mẫu. Tần số lấy mẫu phải thoả mãn định lý

Nyquist-Shannon :fs≥2fmaz

Trong đó:+ fs là tần số lấy mẫu.

+ fmax là tần số cực đại của phổ tín hiệu tương

tự.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 17

Page 18: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

1.2.2 Lượng tử hóaQuá trình lượng tử là quá trình chuyển một xung lấy

mẫu thành một xung có biên độ bằng mức lượng tử gần nhất

hay nói cách khác là lượng tử chuyển đổi các mức biên độ

của tín hiệu đã lấy mẫu sang một trong các giá trị hữu

hạn các mức nhị phân. Lượng tử hoá biến đổi tín hiệu

liên tục theo thời gian thành tín hiệu có biên độ rời

rạc, nhằm làm giảm ảnh hưởng của tạp âm trong hệ thống,

hạn chế các mức cho phép của tín hiệu lấy mẫu và chuẩn

bị truyền tín hiệu gốc từ tương tự sang số. Giá trị thập

phân của các mẫu sau khi lượng tử hoá sẽ được biểu diễn

dưới dạng số nhị phân n bit (N= 2n), với n là độ phân

giải lượng tử hoá, n càng lớn thì độ chia càng mịn, do

đó độ chính xác càng cao.

Do làm tròn các mức nên tín hiệu bị méo dạng do sai số

lượng tử gọi là méo lượng tử, tỷ số tín hiệu trên méo

lượng tử (S/N) được xác định bởi:SN

=6,02n+1,76(dB)

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 18

Page 19: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Hình 1-1 Sơ đồ quá trình tạo tín hiệu số

Lượng tử hóa có hai loại:

Lượng tử tuyến tính: phép nén tín hiệu theo quy

luật đường cong đồng đều, bước lượng tử bằng nhau.

Lượng tử phi tuyến: phép nén tín hiệu theo quy luật

đường cong không đồng đều, tập trung nhiều mức

lượng tử ở những vùng tín hiệu nhỏ. Trong kỹ thuật

nén ảnh, nén video thì loại lượng tử phi tuyến được

dùng nhiều hơn vì nó giảm dung lượng đến mức tối đa

với độ méo lượng tử có thể chấp nhận được.

1.2.3 Mã hóaLà quá trình thay thế mỗi mức điện áp cố định sau

khi lượng tử bằng một dãy nhị phân gọi là từ mã. Tất cả

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 19

Page 20: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

các từ mã đều chứa số xung nhị phân cố định và được

truyền trong khoảng thời gian giữa 2 thời điểm lấy mẫu

cạnh nhau. Bộ mã được sử dụng để tái tạo các xung nhị

phân hoặc các từ mã từ các giá trị đã lượng tử xuất hiện

ở đầu ra của bộ lượng tử hoá.

1.3 Tốc độ bít và thông lượng kênh truyền tín hiệu số

1.3.1 Tốc độ bitTốc độ bit là số lượng bit được truyền đi hay lưu

trữ trong một đơn vị thời gian.C=fs∗n (bit/s)

Trong đó :

+ fs là tần số lấy mẫu (Hz).

+ n là số bit nhị phân trong một ký hiệu.

+ C là tốc độ bit (bps).

1.3.2 Thông lượng kênh truyền tín hiệu sốLà tốc độ số liệu cực đại có thể truyền được trên

kênh truyền có độ rộng băng tần B.

C=B.log2(1+SN) (bps)

Trong đó

+ C là tốc độ bit (bps)

+ SN là tỷ số tín hiệu trên nhiễu trắng.

+ B là băng thông kênh truyền (Hz).

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 20

Page 21: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Tốc độ bit càng lớn thì tín hiệu tương tự khôi phục

lại càng trung thực tuy nhiên nó sẽ là cho dung lượng

lưu trữ và băng thông kênh truyền càng lớn. Trong thực

tế để truyền tín hiệu có tốc độ bit là C (bps) thì cần

băng thông kênh truyền là: B≥

34C (Hz)

Ví dụ: với n = 4, fs = 44,1Khz thì:

Tốc độ truyền thông tin là : C = n x fs = 4 x 44,1 = 176,3.103 bits/s

Và độ rộng băng tần là B≥

34C=

34x 176,4.103=132,3 Khz

1.4 Quá trình biến đổi tín hiệu màu

Hình 1-2 Quá trình biến đổi tín hiệu màu

Một bức ảnh được chuyển từ RGB sang YUV nhằm giảm dung

lượng lưu trữ cũng như truyền đi, trong quá trình giải

mã, trước khi hiển thị ảnh thì nó được biến đổi ngược

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 21

Page 22: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

lại thành RGB. Công thức minh họa quá trình biến đổi như

sau:Y=krR+(1−kb−kr)G+kbB

Cb=0.51−kb

(B−Y)

Cr=0.51−kr

(R−Y)(1)

Với kb+kr+kg=1 , kb = 0.114, kr = 0.299, khi thế vào công

thức (1) thì ta được: Y=0.299R+0.587G+0.114BCb=

0.51−0.114

(B−Y )=−0.169R−0.331G+0.5B

Cr=0.51−0.299

(R−Y)=0.5R−0.419G−0.081B

Nên ta có ma trận biến đổi từ RGB sang YUV như sau:

[Y ¿ ] [Cb¿ ]¿¿

¿¿

Thực hiện tương tự ta suy ra được ma trận biến đổi từ

YUV sang RGB như sau:

[R ¿ ] [G ¿ ] ¿¿

¿¿

1.5 Các tiêu chuẩn lấy mẫu video tín hiệu số

Kiểu lấy mẫu cho ảnh video cũng là một vấn đề khá

quan trọng của kỹ thuật nén ảnh. Một số kiểu lấy mẫu phổ

biến minh họa như hình I.3 và có đặc điểm như sau:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 22

Page 23: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Tốc độ lấy mẫu 4:1:1 - tần số lấy mẫu tín hiệu

chói là 13,5MHz, và mỗi tín hiệu hiệu màu là

3,375MHz.

Tốc độ lấy mẫu 4:2:2 - tần số lấy mẫu tín hiệu

chói là 13,5MHz, và mỗi tín hiệu hiệu màu là

6,75MHz.

Tốc độ lấy mẫu 4:4:4 - cả 3 thành phần có cùng

độ phân giải, nghĩa là tần số lấy mẫu tín hiệu

chói là 13,5MHz, và mỗi tín hiệu hiệu màu là

13,5MHz.

Tốc độ lấy mẫu 4:2:0 - là kiểu phổ biến, tần số

lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu

hiệu màu là 6,75MHz theo cả 2 chiều

Ví dụ : Một bức ảnh có độ phân giải 720 × 576 pixelsĐộ phân giải của thành phần Y là 720 × 576 pixels được

mã hóa bằng từ mã 8 bits.

Nếu sử dụng kiểu lấy mẫu 4:4:4 thì độ phân giải của

thành phần Cb, Cr là 720 × 576 mẫu cũng được mã hóa

bằng từ mã 8 bits.

=> Vậy tổng số bits sử dụng để mã hóa bức ảnh là 720 ×

576 × 8 × 3 = 9 953 280 bits

Nếu sử dụng kiểu lấy mẫu 4:2:0 thì độ phân giải của

thành phần Cb, Cr là 360 × 288 mẫu, cũng được mã hóa

bằng từ mã 8 bits.

=> Vậy tổng số bits sử dụng là (720 × 576 × 8) + (360 ×

288 × 8) × 2 = 4 976 640 bits

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 23

Page 24: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Hình 1-3 Các tiêu chuẩn lấy mẫu phổ biến

Trong kiểu 4:4:4, tổng số mẫu cần thiết là 12 mẫu, do đó

tổng số bit là 12 × 8 = 96 bits, và trung bình là 96/4 =

24 bits/pixel

Trong kiểu 4:2:0, tín hiệu được quét xen kẽ, do đó chỉ

cần thiết 6 mẫu, 4 mẫu cho thành phần Y, 1 mẫu cho thành

phần Cb, 1 mẫu cho thành phần Cr, do đó tổng số bits cần

thiết là 6 × 8 = 48 bits, và trung bình là 48/4 = 12

bits/pixel.

Ta thấy kiểu lấy mẫu 4:2:0 giảm một ½ số lượng bits so

với 4:4:4, đó cũng chính là lý do mà kiểu lấy mẫu này

được sử dụng phổ biến.

1.6 Mô hình nén tín hiệu Video

Hình 1-4 Sơ đồ khối nén tín hiệu video

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 24

Page 25: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Các khối chính là:

- Khối nén dư thừa thời gian.

Dự đoán chuyển động

Bù chuyển động

- Khối nén dư thừa theo không gian.

Biến đổi DCT, DWT

Lượng tử hóa

Xắp xếp lại trật tự và mã hóa Entropy

1.6.1 Nén tín hiệu VideoTín hiệu video có dải phổ nằm trong khoảng 0 -> 6Mhz, do

thành phần tần số cao chỉ xuất hiện ở các đường viền của

hình ảnh nên năng lượng phổ rất ít tập trung ở miền tần

số cao mà chủ yếu tập trung ở miền tần số thấp. Điều đó

có nghĩa là số lượng bit ở miền tần số thấp sẽ nhiều hơn

ở miền tần số cao.

Trong các hệ thống nén, tỉ số nén chính là tham số quan

trọng đánh giá khả năng nén của hệ thống, ta gọi n1, n2

là số lượng bit của tín hiệu trước và sau khi nén nên ta

có công thức như sau:

Tỷ số nén sẽ là C=

n1n2

Phần trăm nén hay còn gọi là độ dư thừa dữ liệu tương

đối.

R=(1−n2n1) x 100%=

n1−n2n1

x 100%

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 25

Page 26: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Nếu n1= n2 thì ta có C =1, và R = 0 nghĩa là không có sự

dư thừa dữ liệu.

Nếu n2<<n1 thì C →∞ , R →1 , ta nói rằng có sự dư thừa dữ

liệu lớn.

Ví dụ : n1 = 100Mb/s, n2 = 20Mb/s thì C = 5:1, R = 80%.

Tức là ảnh có sự dư thừa lớn, hiệu quả nén đạt 80%.

1.6.2 Lượng tin trung bìnhTrước khi nghiên cứu các phương pháp nén, ta cần

đánh giá lượng thông tin chủ yếu được chứa đựng trong

hình ảnh, từ đó xác định dung lượng tối thiểu cần sử

dụng để miêu tả, truyền tải thông tin về hình ảnh.

Thông tin được ký hiệu là ai và có xác suất p(ai) thì

lượng tin được xác định theo công thức sau:

I(ai)= log2 [1

p(ai)]=−log2p(ai)

Theo công thức trên ta thấy lượng tin chứa đựng

trong một hình ảnh sẽ tỉ lệ nghịch với khả năng xuất

hiện của ảnh đó, nghĩa là sự kiện ít xảy ra sẽ chứa đựng

nhiều thông tin hơn và bằng tổng số lượng thông tin của

từng phần tử ảnh.

Gọi lượng tin trung bình của hình ảnh là H(X) và được

tính bằng công thức sau:

H(X)=∑1

Np(ai) ∗ log2 [

1p(ai )

] = −∑1

Np(ai ) ∗log2p(ai )

Xác suất phân bố càng nhiều thì lượng tin trung

bình entropy càng nhỏ. Entropy đạt giá trị cực đại đối

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 26

Page 27: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

với phân bố đều, do đó nếu một ký hiệu có xác suất lớn

sẽ có số Entropy nhỏ.

Ví dụ: Giả sử có một ảnh đen trắng với độ phân giải

lượng tử 8 bit. Ký hiệu i là mức xám của pixel và bộ ký

hiệu A là tập hợp tất cả các mức xám từ 0->255, mức xám

0 tương ứng với màu đen, mức xám 255 tương ứng với màu

trắng. Do đó, Entropy của ảnh là H(X)=∑

0

255p(i)log2p(i)

Giả sử ta có kích thước 4x8 pixels như sau:

21 21 21 95 169 243 243 243

21 21 21 95 169 243 243 243

21 21 21 95 169 243 243 243

21 21 21 95 169 243 243 243

Ta sẽ xét các độ dư thừa của các pixel trong ảnh, hoặc

giữa các ảnh liên tiếp như sau.

Giả sử các mức xám của tín hiệu hình đen trắng độc

lập thống kê với nhau, dựa vào số liệu thống kê cụ

thể là.

Mức xám Số lượng pixel Xác suất.

21 12 3/8

95 4 1/8

169 4 1/8

243 12 3/8

Entropy của phần ảnh tĩnh này là:

H(x) =−38log2

38

−18log2

18

−18log2

18

−38log2

38

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 27

Page 28: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

=−68log2

38−28log2

18

=−0,75 x 1,58+3=1,815 bits/pixel

Tuy nhiên, trong thực tế các mức xám của các pixel

không độc lập thống kê với nhau, nên ta có thể biểu

diễn theo từng cặp pixel liên tiếp như sau:

Giá trị cặp mức xám Số lượng cặp Xác

suất

(21, 21) 8 1/4

(21, 95) 4 1/8

(95, 169) 4 1/8

(169, 243) 4 1/8

(243, 243) 8 1/4

(243, 21) 4 1/8

H(x) =−14log2

14

−18log2

18

−18log2

18

−18log2

18

−14log2

14

−18log2

18

=−24log2

14−48log2

18

=2.5bits/caëp pixels

Ngoài ra còn có thể biểu diễn theo phần chênh lệch

mức xám của 2 pixel liên tiếp như sau.

21 0 0 74 74 74 0 0

21 0 0 74 74 74 0 0

21 0 0 74 74 74 0 0

21 0 0 74 74 74 0 0

Giá trị mức xám Số lượng Xác suất.

21 4 1/8

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 28

Page 29: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

0 16 1/2

74 12 3/8

H(x) =−18log2

18

−12log2

12

−38log2

38

=−0,75 x 1,58+3=1,41 bits /pixel

Như vậy, số lượng tin trung bình tối thiểu cần

thiết để truyền một phần tử ảnh sẽ khác nhau, nghĩa là

độ dư thừa trong ảnh và giữa các bức ảnh sẽ phụ thuộc

vào cách mã hóa Entropy. Do đó cần phải xem xét kỹ để

chọn ra loại mã hóa hiệu quả nhất.

Chương 2. Các kĩ thuật nén Video2.1 Phân loại kĩ thuật nén

Nén video được chia thành hai họ lớn: Nén không tổn

hao và nén tổn hao.

Nén không tổn hao là quy trình biểu diễn các ký

hiệu trong dòng bit nguồn thành dòng các từ mã sao

cho ảnh được khôi phục hoàn toàn giống ảnh gốc, các

thuật toán chỉ phụ thuộc vào cách thống kê nội dung

dữ liệu và thường dựa trên việc thay thế một nhóm

các ký tự trùng lặp bởi một nhóm các ký tự đặc biệt

khác ngắn hơn mà không quan tâm đến ý nghĩa của

dòng bit dữ liệu, nên đòi hỏi phải có thiết bị lưu

trữ và đường truyền lớn hơn.

Nén có tổn hao, tức là ảnh được khôi phục không

hoàn toàn giống ảnh gốc, dạng nén này thích hợp cho

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 29

Page 30: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

việc lưu trữ và truyền ảnh tĩnh, ảnh video qua một

mạng có băng thông hạn chế. Các dạng nén này thường

có hệ số nén cao hơn (từ 2:1 đến 100:1) và gây nên

tổn hao dữ liệu và sự suy giảm ảnh sau khi giải nén

do việc xóa và làm tròn dữ liệu trong một khung hay

giữa các khung. Nó liên quan đến việc dùng các phép

biến đổi tín hiệu từ miền này sang miền khác.

Trong thực tế phương pháp nén tổn hao thường được sử

dụng nhiều hơn và các kỹ thuật nén tổn hao thường sử

dụng như: mã hóa vi sai, biến đổi cosin rời rạc DCT,

lượng tử vô hướng, quét zig-zag, mã hóa Entropy…

2.2 Quá trình biến đổi

Hình 2-5 Mô hình hệ thống nén tổn hao

Tín hiệu ngõ vào được biến đổi nhằm mục đích biểu diễn

một số liệu khác thích hợp để nén hơn so với tín hiệu

nguồn. Ở phía giải mã tín hiệu nén sẽ được biến đổi

ngược lại để thu tín hiệu gốc. Một số phép biến đổi được

áp dụng phổ biến hiện nay như:

2.2.1 Điều xung mã vi sai DPCMCác phương pháp nén dùng DPCM dựa trên nguyên tắc

phát hiện sự giống nhau và khác nhau giữa các điểm ảnh

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 30

Page 31: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

gần nhau để loại bỏ các thông tin dư thừa. Trong DPCM

chỉ có phần khác nhau giữa mẫu - mẫu được truyền đi, sự

khác nhau này được cộng vào giá trị mẫu đã giải mã hiện

hành ở phía giải mã để tạo ra giá trị mẫu phục hồi. Hình

II.2. mô tả sơ đồ khối của bộ mã hóa và giải mã DPCM.

Hình 2-6 Bộ mã hóa và giải mã DPCM

Ví dụMẫu tín hiệu vào 115 117

116 117 118 117 115 116

Sự khác nhau

2 -1 1 1 -1 -2 1

Dòng bit được nén như sau: 115 2

-1 1 1 -1 -2 1

2.2.2 Mã hóa biến đổi

Nhằm biến đổi các hệ số trong miền thời gian (video số),

không gian 2D (bức ảnh tĩnh) thành các hệ số trong miền

tần số. Các hệ số này ít tương quan hơn có phổ năng

lượng tập trung hơn, thuận tiện cho việc loại bỏ thông

tin dư thừa.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 31

Page 32: Luận văn TN

Nếu i = 0

Nếu i > 0

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

2.2.2.1 Biến đổi cosin rời rạc DCTVì ảnh gốc có kích thước rất lớn cho nên trước khi

đưa vào biến đổi DCT, ảnh được phân chia thành các MB

biểu diễn các mức xám của điểm ảnh. Việc phân khối này

sẽ làm giảm được một phần thời gian tính toán các hệ số

chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ

làm tăng độ chính xác khi tính toán với dấu phẩy tĩnh,

giảm thiểu sai số do làm tròn sinh ra. Phép biến đổi DCT

cơ bản hoạt động dựa trên cơ sở ma trận vuông của mẫu

sai số dự đoán, kết quả cho ta một ma trận Y là những hệ

số DCT được minh họa như sau:

Y = AXAT

Trong đó A là ma trận hệ số biến đổi, các thành phần của

A như sau:

Ai, j=Cicos(2j+1)iπ

2N Với

{Ci=√1N ¿ ¿¿¿

¿

¿

Tương đương với Yx, y=CxCy∑

i=0

N−1

∑J=0

N−1Xi, jCos

(2j+1)yπ2N Cos (2i+1)xπ

2N

Phép biến đổi DCT nguyên 4x4 của chuỗi ngõ vào X được

cho bởi công thức

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 32

Page 33: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

A = ¿[ 12cos 0 12cos 0 1

2cos 0 1

2cos 0 ¿ ][√12 cos(π8 ) √12 cos(3π8 ) √12 cos(5π8 ) √12cos(7π8 ) ¿][√12 cos(2π8 ) √12 cos(6π8 ) √12 cos(10π8 ) √12 cos(14π8 )¿]¿

¿

¿

Phép biến đổi ngược DCT cho bởi công thức:X=ATYA Tương đương với:

Xi, j=∑x=0

N−1

∑y=0

N−1CxCyYx, yCos

(2j+1)yπ2N Cos (2i+1)xπ

2N

2.2.2.2 Biến đổi HadamardLà một ví dụ tổng quát hóa của biến đổi Fourier rời rạc,

nó thực hiện các phép toán cộng và trừ trên các ma trận

2m x 2m trực giao, đối xứng, tuyến tính…được định nghĩa

theo công thức sau:Hn

−1=HnT trong đó Hn là ma trận NxN với N = 2m , m thường

là các giá trị 1, 2 ,3 tương ứng với các khối 2x2, 4x4,

và 8x8, Hn được tạo ra từ phép toán Kronecker như sau: Hn

= H1⊗H1.....⊗H1 n lần.

Ví dụ H2 = H1 ⊗ H1

Với H1= 1√2

¿ [1 1 ¿ ] ¿¿

¿

2.3 Quá trình lượng tửSau khi thực hiện biến đối DCT, các hệ số sẽ được lượng

tử hoá dựa trên một bảng lượng tử Q(u,v) với 0 u, v n-1, ≤ ≤ n

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 33

Page 34: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

là kích thước khối. Bảng này được định nghĩa bởi từng

ứng dụng cụ thể, các phần tử trong bảng lượng tử có giá

trị từ 1 đến 255 được gọi là các bước nhảy cho các hệ số

DCT. Quá trình lượng tử được coi như là việc chia các hệ

số DCT cho bước nhảy lượng tử tương ứng, kết quả này sau

đó sẽ được làm tròn xuống số nguyên gần nhất. Các hệ số

năng lượng thấp này, tượng trưng cho các sự thay đổi

pixel - pixel cỡ nhỏ, có thể bị xóa mà không ảnh hưởng

đến độ phân giải của ảnh phục hồi. Tại bộ mã hoá sẽ có

một bảng mã và bảng các chỉ số nội bộ, từ đó có thể ánh

xạ các tín hiệu ngõ vào để chọn được các từ mã tương ứng

một cách tốt nhất cho tập hợp các hệ số được tạo ra. Có

2 loại lượng tử hóa chủ yếu:

2.3.1 Lượng tử vô hướngLượng tử từng giá trị một cách độc lập hay nói cách khác

là ánh xạ một mẫu của tín hiệu ngõ vào tạo thành một hệ

số lượng tử ở ngõ ra. Đây là một quá trình tổn hao vì

khi giải lượng tử, không thể xác định chính xác giá trị

gốc từ số nguyên đã được làm tròn. Lượng tử hóa thuận

theo công thức FQ = round(X/QP)

Lượng tử hóa ngược theo công thức Y = FQ*QP. Với QP là

bước nhảy lượng tử. Ví dụ quá trình giải lượng tử cho

một tín hiệu ngõ vào như sau:

Y

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 34

Page 35: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

XQP =

1

QP =

2

QP =

3

QP =

5-4 -4 -4 -3 -5-3 -3 -2 -3 -5-2 -2 -2 -3 0-1 -1 0 0 00 0 0 0 01 1 0 0 02 2 2 3 03 3 2 3 54 4 4 3 55 5 4 6 5… … …

2.3.2 Lượng tử vectorLà một quá trình biểu diễn một tập vector (mỗi vector

gồm nhiều giá trị) bằng một tập các số hữu hạn các ký

hiệu ở ngõ ra, bảng mã ánh xạ sẽ có các giá trị xấp xỉ

với giá trị gốc. Vector lượng tử sẽ được lưu ở cả bộ mã

hóa và bộ giải mã, quá trình nén một bức ảnh sử dụng

lượng tử vector bao gồm các bước sau.

Phân chia bức ảnh gốc thành các phân vùng MxN pixel

Chọn vector thích ứng nhất từ bảng mã

Truyền chỉ số của vector thích ứng đến bộ giải mã.

Tại bộ giải mã, ảnh cấu trúc lại sẽ xấp xỉ với phân

vùng đã lựa chọn vector lượng tử.

Và sơ đồ khối của lượng tử vector như sau:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 35

Page 36: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Hình 2-7 Quá trình lượng tử vector

2.4 Quá trình mã hóaBộ mã hóa có chức năng loại bỏ độ dư thừa trong các

ký tự ở ngõ ra lượng tử hóa và ánh xạ các ký tự này

thành các từ mã tạo thành dòng bit ở ngõ ra bằng các

loại mã hóa như: mã hóa dự đoán, mã hóa VLC, mã hóa số

học nhị phân, mã hóa theo hình dạng…

2.4.1 Mã hóa độ dài thay đổiKỹ thuật mã hóa độ dài thay đổi VLC dựa trên xác suất

các giá trị biên độ giống nhau trong một ảnh để lựa chọn

các từ mã để mã hoá. Bộ mã hóa có độ dài thay đổi ánh xạ

các ký hiệu ngõ vào thành một chuỗi từ mã có độ dài thay

đổi ở ngõ ra nhưng chứa số lượng bít nguyên. Các ký hiệu

có xác suất cao sẽ được gán từ mã có độ dài ngắn, còn

các ký hiệu có xác suất thấp sẽ được gán từ mã có độ dài

lớn hơn, do đó nó sẽ làm tối thiểu chiều dài trung bình

của từ mã. Tại phía giải nén có các chỉ định mã giống

nhau được dùng để khôi phục lại các giá trị dữ liệu gốc.

Các loại mã hóa VLC cơ bản như: mã hóa Huffman, mã hoá

RLC, mã hóa Exp-Golomb…

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 36

Page 37: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

2.4.1.1 Mã hóa HuffmanMã hóa Huffman là mã hóa thõa mãn tối ưu tính prefix và

phương pháp mã hóa thường dựa vào mô hình thống kê. Dựa

vào dữ liệu gốc, người ta tính xác suất xuất hiện của

các ký tự. Việc tính toán xác suất được thực hiện bằng

cách duyệt tuần tự tệp gốc từ đầu đến cuối và các ký tự

nào có xác suất càng cao thì từ mã càng ngắn nên giảm

chiều dài trung bình của từ mã một cách rõ rệt, mã hóa

Huffman thường được biểu diễn dưới dạng cây mã như sau:

Hình 2-8 Cây mã Huffman

Các bước thực hiện mã hóa Huffman.

Bước 1: Các nguồn tin được liệt kê trong cột theo thứ tự

xác suất xuất hiện giảm dần.

Bước 2: Hai tin cuối có xác suất nhỏ nhất được hợp thành

tin phụ mới có xác suất bằng tổng xác suất các tin hợp

thành.

Bước 3: Các tin còn lại (N-2) với tin phụ mới được liệt

kê trong cột phụ thứ nhất theo thứ tự xác suất giảm dần.

Bước 4: Quá trình cứ thế tiếp tục cho đến khi hợp thành

một tin phụ có xác suất xuất hiện bằng 1.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 37

Page 38: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

2.4.1.2 Mã hóa mức dọc chiều dài RLCThông thường dữ liệu hay có sự trùng lặp, chẳng hạn nếu

một bức ảnh có cùng một màu, độ chói thì những vùng bên

cạnh ảnh đó cũng giống như vậy. Do đó có thể mã hóa bằng

một từ mã đặc biệt nhằm chỉ báo sự bắt đầu và kết thúc

của giá trị lặp lại, mỗi hệ số khác 0 sau giá trị DC

được phát hiện sẽ được gán một từ mã gồm 2 thông số: số

lượng bit 0 đứng trước đó và mức của nó sau khi lượng

tử, để tạo ra từ mã là một đôi (level và run), trong đó

Level biểu thị giá trị của bit và Run biểu thị số lần

lặp lại của bit. Khi dữ liệu truyền có sự trùng lặp thì

truyền từ mã này thay cho nó. Hình II.5. minh họa mã hóa

RLC như sau :

Hình 2-9 Minh họa mã hóa RLC

Từ dữ liệu đầu vào, giá trị 028 lặp lại 5 lần được mã

hóa bằng 3 từ mã ở dữ liệu đầu ra. Giá trị đầu tiên 255

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 38

Page 39: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

đại diện cho cách mã hóa RLC, giá trị thứ 2 là giá trị

được lặp lại, giá trị thứ 3 là số lần lặp lại, nên thay

vì truyền từ mã dài, ta chỉ cần truyền 255 028 3.

2.4.2 Mã hóa số họcĐiểm bất lợi cơ bản của mã hóa dọc chiều dài là việc tạo

ra bảng tra chứa toàn bộ số lượng bit trên mỗi mẫu nên

không thật sự tối ưu, vì số lượng bit tối ưu nhất cho

một ký tự tùy thuộc vào nội dung thông tin, mà thường là

những số rất nhỏ. Đối với những ký tự có xác xuất lớn

hơn 0.5 thì hiệu suất nén không cao, nó chỉ hiệu quả khi

mã hóa những ký hiệu này bằng một từ mã bit đơn. Còn mã

hóa số học thì dựa vào xác suất của nội dung thông tin

nên còn có tên gọi là mã hóa số học thích nghi theo nội

dung, mã hóa số học sử dụng các đặc tính về không gian

và thời gian để ước lượng khoảng xác suất. Nó biến đổi

luồng dữ liệu vào thành một phân số đơn lẻ, và sử dụng

phân số tối ưu nhất để mã hóa dữ liệu, do đó hiệu quả

nén của nó có thể đạt mức tối đa mà giảm chi phí đầu tư

cho lưu trữ.

Giả sử ta có 5 giá trị vector chuyển động (−2, −1, 0,

1, 2) và xác suất của nó như bảng dưới đây. Mỗi vector

sẽ được gán một ngưỡng trong khoảng từ 0.0 đến 1.0 tùy

thuộc vào xác suất xuất hiện của chúng. Ví dụ giá trị “-

2” có xác suất là 0.1 sẽ nằm trong khoảng từ 0->0.1 tức

là bằng 10% của khoảng [0 1], tương tự giá trị “-1” có

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 39

Page 40: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

xác suất là 0.2 sẽ nằm trong khoảng từ 0.1->0.3 tức là

bằng 20% … Như vậy việc phân chia vùng riêng cho từng

giá trị xác suất sẽ thuận tiện cho việc mã hóa.

Vector Xác Lượng tin trung bình = Khoảng chia-2 0.1 3.32 0 → 0.1-1 0.2 2.32 0.1 → 0.30 0.4 1.32 0.3 → 0.71 0.2 2.32 0.7 → 0.92 0.1 3.32 0.9 → 1.0

Các vector sẽ được chia nhỏ thành các khoảng nhỏ theo

xác suất như sau:

Ví dụ quá trình mã hóa cho chuỗi vector (0, −1, 0, 2)

như sau:

Quá trình mã hóa Phạm vi(L → H)

Kýhiệu(L → H)

Khoảng chianhỏ

Chú thích

Cài phạm vi bắtđầu 0 → 1.0

Tìm khoảng contương ứng cho kýhiệu đầu tiên

(0) 0.3 → 0.7

Cài lại khoảngmới cho khoảngcon.

0.3 → 0.7

Tìm khoảng contương ứng cho kýhiệu tiếp theo

(-1) 0.1 →

0.3

Cài lại khoảngbắt đầu mới nằmtrong khoảng

0.34 → 0.42 0.34 = 10% 0.42 = 30%

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 40

Page 41: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

trước đóTìm khoảng tíếptheo (0) 0.3 → 0.

7Cài lại khoảngbắt đầu mới nằmtrong khoảngtrước đó

0.364→0.396

0.364 = 30% 0.396 = 70%

Tìm khoảng tíếptheo (2) 0.9-1.0

Cài lại khoảngbắt đầu mới nằmtrong khoảngtrước đó

0.3928→0.396

0.3928 = 90% 0.396 = 100%

Sau mỗi lần mã hóa một ký hiệu thì phạm vi Low → High

càng nhỏ dần như minh họa ở hình II.6. Số lượng bit cần

thiết để nén chuỗi dữ liệu được tính bởi công thức:

log2(1/P0) + log2(1/P−1) + log2(1/P0) + log2(1/P2) =

8.28bits

Toàn bộ chuỗi dữ liệu có thể được truyền đi bởi bất kỳ

một giá trị phân số nào nằm trong khoảng 0.3928-0.396,

giả sử giá trị 0.394 có thể được mã hóa như là một phân

số có dấu chấm tĩnh bằng từ mã 9 bit, do đó chuỗi vector

(0, -1, 0, 2) sẽ được nén bằng từ mã 9bits.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 41

Page 42: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Hình 2-10 Minh họa sự sắp xếp trong khoảng [0-1] thànhnhững vùng nhỏ hơn sau mỗi ký hiệu được mã hóa

Hiệu quả của mã hóa Entropy có được như mong muốn hay

không là tùy thuộc vào độ chính xác trong xác suất của

ký hiệu.

Quá trình giải mã số học.Quá trình giải mã Phạm vi Khoảng chia

nhỏKý hiệu giảimã

Cài phạm vi bắt đầu 0 → 1Tìm khoảng con tương ứngcho ký hiệu đầu tiên 0.3 → 0.7 0

Cài lại khoảng mới chokhoảng con. 0.3 → 0.7

Tìm khoảng con tương ứngcho ký hiệu tiếp theo 0.34 → 0.42 -1

Cài lại khoảng bắt đầumới nằm trong khoảngtrước đó

0.34 → 0.42

Tìm khoảng tíếp theo 0.364→0.396 0Cài lại khoảng bắt đầumới nằm trong khoảngtrước đó

0.364→0.396

Tìm khoảng tíếp theo 0.3928→ 0.396 2

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 42

Page 43: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

2.5 Tiêu chuẩn đánh giá chất lượng ảnh nén

Đánh giá chất lượng video thông qua các giá trị cung cấp

bởi hệ thống xử lý, và việc suy giảm chất lượng tín hiệu

có thể nhìn thấy được ( thông thường chúng được so sánh

với tín hiệu gốc. Qua hệ thống, chúng ta có thể thấy

được rằng những thay đổi về hình dạng và việc định chuẩn

chất lượng video là rất quan trọng. Để đánh giá chất

lượng của bức ảnh (hay khung ảnh video) ở đầu ra của bộ

mã hoá, người ta thường sử dụng các tham số truyền thống

sau để đánh giá:

Sai số bình phương trung bình – MSE (mean square error)

định nghĩa cho cường độ sai khác giữa ảnh gốc và ảnh dự

đoán

Mean Squared Error : MSE=1N2

∑i=0

N−1

∑j=0

N−1(Ci j−Ri j)

2

Tỉ số tín hiệu trên nhiễu đỉnh – PSNR (peak to signal to

noise ratio).

PSNR=10log10(2b−1)2

MSE (dB)

Trong đó NxN kích thước bù chuyển độnghệ số Ci, j và Ri, j tương ứng với mẫu hiện tại và

vùng mẫu tham khảo.

b số lượng bit/ mẫu.

Thông thường, nếu PSNR 40dB ≥ thì hệ thống mắt người

gần như không phân biệt được giữa ảnh gốc và ảnh khôi

phục, tức là ảnh nén có chất lượng xuất sắc.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 43

Page 44: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

30 dB ¿ PSNR < 33 dB thì chất lượng ảnh nén

bình thường, mắt người có sự phân biệt được.

PSNR < 30 dB thì chất lượng ảnh nén kém.

Sai số tuyệt đối trung bình - MAE (Mean Absolute Error)

Mean Absolute Error : MAE=1N2

∑i=0

N−1

∑j=0

N−1|Ci j−Ri j|

Tổng của các sai số tuyệt đối- SAE (Sum of Absolute Errors)

Sum of Absolute Errors : SAE=∑i=0

N−1

∑j=0

N−1|Ci j−Ri j|

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 44

Page 45: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Chương 3. Các chuẩn nén thuộc họ

MPEC trước H.265/HEVC

3.1 Giới thiệu về lịch sử phát triển của chuẩn MPEG

Hình 3-11 Quá trình phát triển của kĩ thuật nén MPEG quacác giai đoạn

Thuật ngữ MPEG viết tắt của cụm từ Moving Picture

Experts Group là 1 nhóm chuyên nghiên cứu phát triển các

tiêu chuẩn về hình ảnh số và nén âm thanh theo chuẩn

ISO/IEC từ năm 1988. Cho đến nay nhóm làm việc MPEG đã

phát triển và phát hành nhiều tiêu chuẩn nén cho các

loại ứng dụng khác nhau, nhưng nổi bật là các chuẩn

MPEG-1, MPEG-2, MPEG-4, H.264/AVC và H.265/HEVC . MPEG

chỉ là một tên riêng, tên chính thức của nó là: ISO/IEC

JTC1 SC29 WG11.

3.2 Các tiêu chuẩn nén trước H.265/HEVCVì thời gian có hạn nên trong luận văn tốt nghiệp

này, chúng ta lướt qua một số nét nổi bật nhất của 2

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 45

Page 46: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

chuẩn MPEG-1 và MPEG-2 và chuẩn H.264 – chuẩn nén video

đang được sử dụng rộng rãi nhất hiện nay.

3.2.1 Tiêu chuẩn MPEC-1Chuẩn MPEG-1 xuất hiện vào 11/1992 là chuẩn khởi

đầu cho việc nén các ảnh động và đây cũng là nền tảng

phát triển cho các chuẩn nén khác trong họ MPEG, nó được

mệnh danh là chuẩn “khởi động thiết bị số“. MPEG-1 định nghĩa

một tiêu chuẩn chuẩn mã hoá video và âm thanh lưu trữ

trong CD-ROM, đĩa Winchester với tốc độ vào khoảng

1,5Mbit/s, độ phân giải hình ảnh là 352 x 240 (30

frame/s) hay 352x288 (25 frame/s). Chuẩn MPEG-1 được ứng

dụng trong các phần mềm huấn luyện bằng máy tính, các

game hành động, video chất lượng VHS, Karaoke..

Tín hiệu video số MPEG-1 bao gồm một tín hiệu chói Y và

2 tín hiệu màu Cr, Cb với tỷ số lấy mẫu là 2:1. Trước

khi mã hóa các ảnh có thể được sắp xếp lại theo trật tự

giải mã mới vì bộ giải mã chỉ có thể giải mã được ảnh B

sau khi đã giải mã ảnh P và I. Sau quá trình giải mã,

các ảnh được sẽ được sắp xếp lại như cũ.

Sau khi chọn kiểu ảnh, bộ mã hoá sẽ đánh giá chuyển động

cho mỗi khối MB và tạo ra một vector chuyển động cho một

ảnh P và 2 vector chuyển động cho ảnh B.

Tùy thuộc kiểu ảnh mà tín hiệu sai số được phát hiện

bằng cách tìm ra sai số giữa dự đoán bù chuyển động và

dữ liệu hiện tại trong mỗi MB. Tín hiệu sai số dự đoán

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 46

Page 47: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

được chuyển đến khối DCT 8x8 và bộ lượng tử để tạo hệ số

lượng tử. Một bộ điều khiển tốc độ bit có nhiệm vụ điều

chỉnh dữ liệu ngõ ra thông qua điều chỉnh bước lượng tử.

Các hệ số này được quét theo ma trận Zig-Zag và mã hoá

bằng mã Entropy rồi mới đưa ra kênh truyền.

3.2.1.1 Các đặc điểm của tiêu chuẩn MPEG-1 Cấu trúc lấy mẫu 4:2:0

Chỉ có khả năng quét liên tiếp.

Biểu diễn mẫu bằng từ mã 8 bits, độ chính xác của

quá trình lượng tử và biến đổi DCT là 9 bits.

Sử dụng phương pháp DPCM để lượng tử hóa cho hệ số

DC. Bù chuyển động cho các MB 16x16 trong cùng một

khung hình hoặc giữa các khung với nhau.

Độ chính xác dự đoán chuyển động là 1 pixel.

Chuẩn MPEG-1 có 4 kiểu ảnh đó là Intra, Predicted,

Bidirectional và ảnh D (DC coded picture). Nó gần

giống ảnh I nhưng chỉ có thành phần một chiều ở đầu

ra DCT được thể hiện. Nó cho phép dò nhanh nhưng

cho chất lượng ảnh thấp.

3.2.1.2 Cấu trúc dòng bít của MPEG-1Chuẩn MPEG-1 định nghĩa một kiểu phân cấp cấu trúc

trong dữ liệu Video và đây cũng là cấu trúc dữ liệu

chung cho cả chuẩn MPEG về sau. Cấu trúc dữ liệu như

sau:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 47

Page 48: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

+ Khối (Block) gồm 8x8 pixels tín hiệu chói và màu được

định nghĩa dùng cho nén DCT.

+ Tổ hợp khối (Macroblock) gồm các khối Y, Cb và Cr

tương ứng với nội dung thông tin của một khối 16x16

pixel của thành phần chói hoặc khối 8x8 của 2 thành phần

màu trong hình ảnh gốc. Một MB bao gồm 6 khối trong đó

có 4 khối Y, 1 khối Cb và 1 Cr như hình vẽ, các khối sẽ

được đánh số thứ tự bắt đầu bằng 1.

+ Mảng (Slice) gồm nhiều MB. Kích thước slice lớn nhất

là 1 ảnh, nhỏ nhất là 1 MB Thứ tự các MB bên trong slice

được xác định từ trái qua phải, trên xuống dưới. Phần

header của slice chứa thông tin về vị trí của mảng trong

toàn bộ ảnh và hệ số của bộ lượng tử. Slice rất quan

trọng trong việc định lỗi, nếu dòng dữ liệu có chứa lỗi,

bộ giải mã có thể bỏ qua và tiếp tục ở slice kế tiếp.

Nhiều slice trên dòng dữ liệu cho phép che giấu lỗi tốt

hơn và được dùng để cải thiện chất lượng hình ảnh.

+ Ảnh (Picture): gồm nhiều slice cho phép bộ giải mã xác

định loại mã hóa khung. Thông tin header để chỉ thứ tự

truyền khung để bộ giải mã sắp xếp lại các ảnh đúng thứ

tự, ngoài ra thông tin header còn chứa các thông tin về

đồng bộ, độ phân giải, phạm vị của vector chuyển động …

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 48

Page 49: Luận văn TN

Hình III.2. Cấu trúc chuỗi video MPEG

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

+ Nhóm ảnh (GOP): gồm nhiều ảnh bắt đầu từ ảnh I. Chỉ

báo điểm bắt đầu cho việc biên tập và việc tìm kiếm.

Phần header chứa mã điều khiển và mã thời gian 25 bit

cho thông tin định thời.Cấu trúc của một GOP được mô tả

bằng 2 tham số:

- N: là các ảnh trong GOP

- M: là khoảng cách giữa các ảnh P-pictures.

Ví dụ: Ta có 1 GOP như sau :

B1 B2 I3 B4 B5 B7 B8 P9 B10 B11 P12.Tức N = 12 và M = 3.

+ Chuỗi ảnh (Sequence): bắt đầu là một Sequence Header,

1 hay nhiều GOP và 1 mã kết thúc chuỗi End-of-Sequence.

Thông tin header chứa kích thước mỗi chiều của bức ảnh,

kích thước điểm ảnh, tốc độ bit của dòng video số, tần

số ảnh, bộ đệm tối thiểu cần có. Chuỗi ảnh và thông tin

header còn được gọi chung là dòng cơ bản ES.

Tiêu chuẩn nén MPEG-1 cho phép truy cập các khung hình

ngẫu nhiên video, tìm kiếm thuận nghịch trên dònh tín

hiệu nén biên tập và phát lại trên dòng tín hiệu nén.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 49

Page 50: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Các công cụ của nó đều có trong các tiêu chuẩn MPEG-2,

nên MPEG-2 vẫn có thể giải mã các dòng tín hiệu MPEG-1.

3.2.2 Tiêu chuẩn MPEG-2

3.2.2.1 Các đặc điểm của tiêu chuẩn MPEG-2Kỹ thuật nén MPEG-2 xuất hiện vào 1995, định nghĩa

cho một tiêu chuẩn kỹ thuật “truyền hình số”. MPEG-2 có thể

tạo hình ảnh lớn gấp 4 lần MPEG-1 với độ nét cao hơn và

rõ hơn (720 x 480 và 1280 x 720) cho phép mã hoá ở nhiều

mức độ phân giải khác nhau đáp ứng cho nhiều ứng dụng

như ứng dụng 2-5Mbps trong SDTV và 6-8Mbps trong DVD,

20Mbps trong HDTV, đặc biệt được ứng dụng trong truyền

hình số mặt đất với mỗi thiết bị khác nhau, sẽ có các bộ

mã hoá và giải mã khác nhau nhằm giảm băng thông đường

truyền.

Những cải tiến của nó như sau:

Chuẩn nén MPEG-2 có tốc độ bit > 4 Mbit/s.

Cấu trúc lấy mẫu 4:4:4, 4:2:2, 4:2:0.

Các giá trị hệ số DCT có thể biểu thị với mức độ

chính xác cao.

Các ma trận lượng tử có thể thay đổi theo mức

frame, thành phần màu.

Có khả năng quét xen kẽ và liên tục, cho phép xấp

xỉ bù chuyển động, xây dựng cơ sở dự báo trên cơ sở

mành.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 50

Page 51: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Khả năng tách lỗi và giảm độ nhạy tín hiệu nén đối

với các lỗi truyền, nếu tỷ số nén cao bị ảnh hưởng.

Độ chính xác mẫu vào là 10 bit. Dùng lượng tử DPCM

chính xác cho các hệ số DC.

Có tính tương hợp và co dãn cao theo không gian,

thời gian.

Độ phân giải ước lượng chuyển động là ½ pixel, 1

pixel.

MPEG-2 định nghĩa các profile và các level khác nhau cho

phù hợp với nhiều loại ứng dụng. Có 5 định nghĩa profile

và 4 level như sau.Simple Main SNR Spatially High

Low4:2:0, 352 x

288 4Mbps

4:2:0, 352

x 288

4Mbps, I, P

,B

Main

4:2:0 720 x

576 15

Mbps, I, P

4:2:0 720 x

576

15 Mbps, I,

P, B

4:2:0 720 x

576 15

Mbps, I, P,

B

4:2:0 720 x

576 20Mbps,

I, P, B

High

1440

4:2:0 1440 x

1152 60

Mbps, I, P,

B

4:2:0 1440 x

1152, 60

Mbps, I, P,

B

4:2:0,

4:2:2

1440 x 1152

80 Mbps, I,

P, BHigh 4:2:0 1192 x

1152 80

Mbps, I, P,

4:2:0,

4:2:2 1192

x 1152

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 51

Page 52: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

B100 Mbps I

P, B

3.2.2.2 Sự khác nhau chính giữa MPEG-1 và MPEG-2MPEG-1 MPEG-2

Băng thông ở mức trung bình(tối đa 1.5 Mbits/sec)

Băng thông lớn (tối đa 40Mbits/sec)

1.25 Mbits/sec video 352 x 240x 30 Hz Kích thước khổ rộng.

2 kênh âm thanh 250 Kbits/sec Lên đến 5 kênh âm thanh (nhưsurround sound)

Không quét xen kẽ. Có thể quét xen kẽ.

Thích hợp cho lưu trữ CD. Có thể dùng trong truyền hìnhphân giải cao HDTV

3.2.3 Tiêu chuẩn MPEC-4Phiên bản đầu tiên của MPEG-4 xuất hiện vào 2/1999.

Cuối 1999 MPEG-4 v2 ra đời và trở thành tiêu chuẩn quốc

tế vào đầu năm 2000. So với MPEG-1, MPEG-2 thì MPEG-4 có

nhiều nổi bật hơn như hiệu suất nén cao, vận hành trên

cơ sở nội dung…và rõ ràng có nhiều ứng dụng hơn. MPEG-4

định nghĩa một tiêu chuẩn cho các ứng dụng truyền thông

đa phương tiện, các hình ảnh, âm thanh và dữ liệu đồ hoạ

và việc tái hợp chúng trên thiết bị thu, hay nói cách

khác nó là sự hội ngộ giữa truyền hình và Web. Đặc điểm

chính của MPEG-4 là mã hóa video và audio ở tốc độ bit

rất thấp. Thực tế tiêu chuẩn này tối ưu ở ba ngưỡng tốc

độ bit sau:

Dưới 64kbps|

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 52

Page 53: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Từ 64 đến 384 kbps|

Từ 384 đến 4Mbps|

Hơn nữa một đặc điểm quan trọng của MPEG-4 là cho phép

khôi phục lỗi tại phía thu nên rất thích hợp cho các ứng

dụng truyền qua môi trường sẽ xảy ra lỗi như moblie,

wireless…Chuẩn MPEG-4 là chuẩn quốc tế đầu tiên định

nghĩa các VOP mà trong đó các phần của một cảnh có thể

được thao tác riêng rẽ trong khi những phần khác vẫn

không đổi. Những profile và level khác nhau trong MPEG-4

cho phép sử dụng tốc độ bit lên đến 38.4Mbps và việc xử

lý chất lượng studio lên đến 1.2Gbps. MPEG-4 đạt yêu cầu

ứng dụng cho các dịch vụ nội dung video có tính tương

tác và các dịch vụ truyền thông video trực tiếp hay lưu

trữ.

Các đối tượng khác nhau trong ảnh gốc được mã hóa

và truyền đi một cách riêng biệt, như ta đã biết không

có một phương pháp mã hóa nào là tối ưu hoàn toàn. DCT

và phép lượng tử chỉ tối ưu với các ứng dụng có băng

thông hạn chế, các ảnh có độ chói ít thay đổi, nhưng với

ảnh nhiều chi tiết, có kích thước nhỏ thì không tối ưu.

Lấy ví dụ nếu một cảnh có chứa các dòng text, nếu mã hóa

bằng MPEG-1, MPEG-2 thì sẽ không hiệu quả vì nó chỉ xem

đó như là chi tiết ảnh thông thường.

Trái lại, MPEG-4 cho phép giải mã luồng text kết

hợp với video và các thông tin trong luồng bit có thể

hiện thị nhiều dạng khác nhau tùy thuộc vào lựa chọn của

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 53

Page 54: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

người sử dụng ví dụ như tùy chọn ngôn ngữ... nên mang

lại hiệu suất cao hơn.

Tuy nhiên MPEG-4 cũng có một số nhược điểm là bộ giải mã

phải có khả năng giải mã hết tất cả các luồng bit mà nó

hỗ trợ và có khả năng kết hợp. Do đó phần cứng bộ giải

mã MPEG-4 phức tạp hơn MPEG-2 rất nhiều. Cũng chính vì

vậy mà các nhà nghiên cứu luôn nỗ lực tìm tòi, phát minh

những công cụ mã hóa tối ưu hơn.

3.2.4 Tiêu chuẩn H.264

3.2.4.1 Giới thiệu chungH.264 / MPEG-4 AVC (Advanced Video Coding) là chuẩn nén

khối bù chuyển động định hướng dựa trên tiêu chuẩn nén

lossy phim

H.264 / MPEG-4 AVC được phát triển bởi sự hợp tác của

VCEG ITU-T và ISO / IEC MPEG. Đội dự án này được biết

đến với cái tên Joint Video Team (JVT).

Các tiêu chuẩn của phiên bản đầu tiên của H.264 / MPEG-4

AVC được hoàn thành tháng 5 năm 2003

Mục đích của đội dự án JVT là tạo ra một tiêu chuẩn nén

có khả năng cung cấp chất lượng hình ảnh tốt ở tốc độ

bit thấp hơn đáng kể so với tiêu chuẩn trước đó (thấp

hơn một nửa hoặc ít hơn so với H.263)

Và cuối cùng sau đó H.264 / MPEG-4 AVC cũng được tạo

ra. H.264 / MPEG-4 AVC đã cung cấp đầy đủ linh hoạt các

tính năng cần thiết để cho phép tiêu chuẩn này được áp

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 54

Page 55: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

dụng cho một loạt các ứng dụng trên một loạt các mạng và

hệ thống, bao gồm tốc độ bit thấp và cao, thấp và video

độ phân giải cao.

3.2.4.2 Các ứng dụng hiện đang sử dụng H.264/AVCH.264 / MPEG-4 AVC được sử dụng trong Streaming

internet sources : Vimeo, YouTube và iTunes Store …

H.264 / MPEG-4 AVC được sử dụng trong Web software :

Adobe Flash Player và Microsoft Silverlight …

Bên canh đó H.264 / MPEG-4 AVC còn được sử dụng trong

truyền tải video chất lượng cao như trong các chương

trình phát sóng HDTV : ATSC, ISDB-T, DVB-T, DVB-T2, DVB-

C, DVB-S và DVB-S2, Blu-ray Disc…

Ngoài ra thì H.264 / MPEG-4 AVC còn được sử dụng như

một định dạng ghi trong chuẩn AVCDC - Advanced Video

Coding High Definition được phát triển bởi Sony và

Panasonic và được sử dụng trong các thiết bị ghi video

HD của Canon và Nikon DSLR.

3.2.4.3 So sánh H.264/AVC và các chuẩn trước đóVideo mã hóa theo chuẩn H.264 / MPEG-4 AVC là mã hóa hỗn

hợp dựa trên các chuẩn trước đó nên việc mã hóa có nhiều

điểm rất giống với tiêu chuẩn đời trước (H.26x)

Tuy nhiên các tính năng mới cho phép H.264 / MPEG-4 AVC

có thể nén video hiệu quả hơn nhiều so với các tiêu

chuẩn cũ và cung cấp linh hoạt hơn để áp dụng cho một

loạt các môi trường mạng khác nhau.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 55

Page 56: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

H.264 / MPEG-4 AVC đã sử dụng các thiết kế mới trong

các bộ biến đổi (transform) và lượng tử hóa

(quantization) cụ thể như sau:

H.264 / MPEG-4 AVC đã sử dụng bộ mã hóa thích nghi lựa

chọn giữa các khối 4 × 4 và 8 × 8 chuyển đổi kích thước

cho các số nguyên chuyển đổi hoạt động.

Quá trình Logarithmic kiểm soát kích thước bước lượng tử

cho phép việc quản lý tốc độ bít được thực hiện một cách

dễ dàng hơn và đơn giản hóa quá trình lượng tử nghịch

đảo-trải rộng (inverse-quantization scaling).

3.2.4.3.1Quá trình dự đoán liên khung (intra -Prediction)H.264 / MPEG-4 AVC sử dụng một phương pháp dự đoán không

gian đa chiều để giảm sự dư thừa không gian bằng cách sử

dụng các mẫu lân cận như là một dự đoán cho các đối

tượng mẫu.

Trong H.264 / MPEG-4 AVC mỗi MB có thể được mã hóa bằng

cách sử dụng các khối pixel mà đã được mã hóa trong

khung hiện tại như hình vẽ dưới đây:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 56

Page 57: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Bên cạnh đó H.264 / MPEG-4 AVC còn sử dụng công nghệ

Multi-picture inter-picture prediction cho phép sử dụng lên đến

16 reference frames so với 1/2 cho khung P / B trong

tiêu chuẩn trước đó.

H.264 / MPEG-4 AVC còn sử dụng khối bù chuyển động với

kích cỡ Block size thay đổi - Variable block-size motion

compensation (VBSMC) bao gồm các block size kích thước

16×16, 16×8, 8×16, 8×8, 8×4, 4×8.

H.264 / MPEG-4 AVC có khả năng sử dụng nhiều vector

chuyển động. Lên đến 32 vector trong trường hợp của một

khối mẫu B x macroblock được xây dựng từ 16 4 × 4 phân

vùng.

H.264 / MPEG-4 AVC sử dụng Quarter-pixel (1/4) hoặc

thậm chí 1/8 điểm ảnh chính xác cho việc bù chuyển động,

cho phép mô tả chính xác những sự thay đổi của khu vực

di chuyển.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 57

Page 58: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

3.2.4.3.2Bộ lọc vòng (Loop Filter)H.264 / MPEG-4 AVC sử dụng m ột bộ lọc trong vòng

deblocking giúp ngăn ngừa các tín hiệu nhiễu phổ biến

trong DCT dựa trên các kỹ thuật nén hình ảnh.

Trong H.264 / MPEG-4 AVC một bộ lọc được áp dụng cho mỗi

macroblock giải mã để giảm sự méo tín hiệu (blocking

distortion)

 Kết quả của những thay đổi ở trên làm cho việc hiển thị

và nén hình ảnh có hiệu quả tốt hơn như hình vẽ dưới

đây.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 58

Page 59: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Ma

3.2.4.3.3Mã hóa EntropiH.264 / MPEG-4 AVC sử dụng lý thuyết Context-adaptive

binary arithmeticcoding (CABAC) là một phương pháp mã

hóa số học, trong đó các mô hình xác suất được cập nhật

dựa trên số liệu thống kê mã hóa trước đó.

H.264 / MPEG-4 AVC sử dụng một công nghệ phổ biến, đơn

giản và có cấu trúc độ dài mã hóa biến đổi (VLC) cho rất

nhiều các đối tượng cú pháp không được mã hóa bởi CABAC

hoặc CAVLC. Một biểu tượng sẽ được chuyển đổi thành một

mã nhị phân với chiều dài quy định (n bit).

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 59

Page 60: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Với tất cả các điểm nổi bật kể trên H.264 / MPEG-4 AVC

hiện nay đã trở nên vô cùng quan trọng và phổ biến trong

tất cả các lĩnh vực của đời sống hiện đại. H.264 / MPEG-

4 AVC có ý nghĩa rất lớn cho các ngành công nghiệp

truyền hình, internet, điện tử tiêu dùng, điện thoại di

động và an ninh...

Nó mô tả và xác định một phương pháp mã hóa video mà có

thể cho hiệu suất tốt hơn so với bất kỳ tiêu chuẩn trước

đó (chưa có H.265)

H.264 / MPEG-4 AVC có thể để nén video vào một không

gian nhỏ hơn, có nghĩa là một video clip nén chiếm băng

thông truyền tải ít hơn và hoặc không gian lưu trữ ít

hơn so với các bộ codec cũ.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 60

Page 61: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Chương 4. Chuẩn nén H.265/HEVC4.1 Tổng quan về chuẩn nén H.265/HEVC

4.1.1 Lịch sử phát triển của chuẩn nén H.265/HEVCVCEG đã bắt đầu nghiên cứu về thế hệ tiếp theo của

H.264 từ năm 2004, bằng cách phát triển ra 1 chuẩn nén

video mới hoàn toàn, hoặc là phát triển tiếp từ H.264.

Các kĩ thuật khác nhau để năng cao tiềm năng của chuẩn

H.264 được khảo sát trong tháng 10 năm 2004. Tại cuộc

họp tiếp theo của VCEG trong tháng 1 năm 2005, VCEG bắt

đầu chỉ định một số tiêu chí kĩ thuật quan trọng (Key

Technical Areas - KTA) cho NGVC - Next-gen Video Coding.

Một cơ sở phần mềm là KTA Codebase cho NGVC đã được phát

triển dựa trên mô hình chung của MPEG và VCEG cho H.264.

Yêu cầu về chất lượng của NGVC được đề ra là giảm

bitrate còn một nửa mà vẫn giữ nguyên chất lượng so với

H.264, ở tất cả các profile, hoặc giảm 25% bitrate cùng

độ phức tạp giảm 1 nửa, hoặc thậm chỉ giảm bitrate hơn

nữa và tăng mức độ phức tạp trong khi encode lên. Công

nghệ của năm 2009 chưa đủ mạnh nên HEVC được định nghĩa

như là phần mở rộng của H.264 chứ không phải là hướng

phát triển mới hoàn toàn. MPEG đã bắt đầu nghiên cứu dự

án tương tự vào năm 2007, lấy tên là HPVC - High

Performance Video Coding, nhưng bitrate trung bình chỉ

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 61

Page 62: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

giảm 20% so với AVC High Profile, điều này đã dẫn đến sự

hợp tác với VCEG của MPEG. Cuộc họp vào tháng 4 năm 2010

đã tiến hành lập ra nhóm JCT-VC và các kĩ thuật mã hóa

được đem ra bàn thảo, tổng cộng có hơn 27 đề xuất được

gửi. Các đnahs giá cho thấy rằng H.265 có thế đạt tỉ

suất nén cao gấp đôi so với H.264. Cũng tại cuộc họp, 2

dự án NGVC và HPVC được hợp nhất lại, lấy tên là HEVC,

chính thức được gọi tắt là H.265. Ngay sau đó, JCT-VC đã

kết hợp những tính năng tốt nhất của 2 dự án trên vào

một codebase duy nhất cho HEVC.

4.1.2 Lịch trình triển khai và các sản phẩm liên quan

Khoảng thời gian để hoàn thành các tiêu chuẩn HEVC là

như sau:

Tháng Hai năm 2012: Ủy ban Dự thảo hoàn thành Dự thảo

tiêu chuẩn.Tháng 7 năm 2012: Công bố Dự thảo tiêu chuẩn

quốc tế. Tháng 1 năm 2013: Dự thảo chính thức Tiêu chuẩn

quốc tế (sẵn sàng để phê chuẩn).

4.1.2.1 Năm 2012Ngày 29/02/2012, tại Đại hội di động thế giới 2012,

Qualcomm trình diễn một bộ giải mã HEVC chạy trên một

máy tính bảng Android, với một Qualcomm Snapdragon xử lý

lõi kép S4 tốc độ 1,5 GHz, cho thấy H.264/MPEG-4 AVC và

HEVC phiên bản của cùng một nội dung chơi video cạnh

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 62

Page 63: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

nhau. Trong cuộc biểu tình này HEVC báo cáo cho thấy gần

như giảm tốc độ bit 50% so với H.264/MPEG-4 AVC.

Ngày 22/08/2012, Ericsson thông báo rằng bộ mã hóa HEVC

đầu tiên của thế giới, Ericsson SVP 5500, sẽ được trình

chiếu tại sắp tới Hội nghị Quốc tế phát thanh truyền

hình (IBC) triển lãm thương mại 2012. Các bộ mã hóa

Ericsson SVP 5500 HEVC được thiết kế để mã hóa thời gian

thực của video để giao cho các thiết bị di động. Cùng

ngày, có thông báo rằng các nhà nghiên cứu đang có kế

hoạch mở rộng MPEG-DASH để hỗ trợ HEVC trong tháng tư

năm 2013.

Ngày 02/09/2012, Vanguard Video, trước đây là giải pháp

phần mềm Vanguard (VSS), đã công bố thời gian thực HEVC

phần mềm mã hóa chạy ở 1080p30 (1920x1080, 30fps) trên

một bộ xử lý Intel Xeon duy nhất. Bộ mã hóa này đã được

chứng minh tại IBC 2012.

Ngày 06/09/2012, Tổng công ty Rovi thông báo rằng một

MainConcept SDK cho HEVC sẽ được phát hành vào đầu năm

2013 ngay sau khi HEVC được chính thức phê chuẩn. Các

HEVC MainConcept SDK bao gồm một bộ giải mã, mã hóa, và

đa vận chuyển cho Microsoft Windows, Mac OS, Linux, iOS

và Android. Các bộ mã hóa HEVC MainConcept SDK đã được

chứng minh tại triển lãm thương mại IBC năm 2012.

Ngày 09/09/2012, ATEME chứng minh tại triển lãm thương

mại một bộ mã hóa HEVC rằng mã hóa video với độ phân

giải 3840x2160p ở 60 fps với tốc độ bit trung bình là 15

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 63

Page 64: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

IBC 2012 Mbit/s. ATEME đang có kế hoạch phát hành mã hóa

HEVC của họ trong tháng 10 năm 2013.

4.1.2.2 Năm 2013Trên 07 tháng một năm 2013, hệ thống ViXS thông báo rằng

họ sẽ hiển thị các SoC phần cứng đầu tiên có khả năng

chuyển mã video đến 10 hồ sơ chính của HEVC tại 2013

quốc tế CES. Cùng ngày Tổng công ty Rovi thông báo rằng

sau khi tiêu chuẩn HEVC được phát hành rằng họ có kế

hoạch để bắt đầu thêm hỗ trợ cho HEVC SDK MainConcept

của họ và để họ DivX sản phẩm.

Trên 08 Tháng Một 2013, Broadcom BCM7445 công bố đó là

một Ultra HD con chip giải mã có khả năng giải mã HEVC

lên tới 4096x2160p ở 60 fps. Các BCM7445 là 28 nm kiến

trúc ARM Chip có khả năng 21.000 Dhrystone MIPS với khối

lượng sản xuất dự kiến cho giữa năm 2014.

Trên 08 Tháng Một 2013, Vanguard video công bố sự sẵn có

của V.265, một tinh khiết-phần mềm HEVC mã hóa chuyên

nghiệp có khả năng hiệu suất thời gian thực.

Ngày 25/01/2013, NGCodec công bố sự sẵn có của tự do

H.265/HEVC tuân thủ đoạn thử nghiệm.

Ngày 04/02/2013, NTT DoCoMo công bố rằng bắt đầu từ

tháng ba sẽ bắt đầu cấp giấy phép thực hiện các phần mềm

giải mã HEVC. Các phần mềm giải mã có thể cho phép phát

lại của 4K UHDTV tại 60 fps trên máy tính cá nhân và

điện thoại thông minh và 1080p trên được lên kế hoạch để

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 64

Page 65: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

chứng minh tại Đại hội di động thế giới năm 2013. Trong

một tài liệu JCT-VC NTT DoCoMo cho thấy bộ giải mã phần

mềm HEVC của họ có thể giải mã 3840x2160 ở 60 fps sử

dụng 3 chủ đề giải mã trên một lõi 2.7 GHz quad Ivy

Bridge CPU.

Ngày 11/02/2013, các nhà nghiên cứu từ MIT đã chứng minh

trên thế giới xuất bản lần đầu HEVC ASIC bộ giải mã ở

mạch Solid-State Hội nghị quốc tế (ISSCC) năm 2013. [56]

con chip của họ là khả năng giải mã một 3840x2160p ở tốc

độ 30 fps dòng video trong thời gian thực tiêu thụ dưới

0.1W quyền lực.

Ngày 14/03/2013, hệ thống Ittiam công bố sẵn có và phần

mềm cấp phép của HEVC (H.265) Video Encoder và Decoder

for Professional, Enterprise và tiêu dùng Digital Media

thị trường. Các HEVC Encoder là một phần mềm thực hiện

trên Intel x86 dựa trên nền tảng, có khả năng độ nét cao

(HD) mã hóa video chất lượng phát sóng. Phần mềm giải mã

có sẵn trên ARM CortexTM-A9 và SoC CortexTM-A15 dựa cho

phép một loạt các thiết bị điện tử tiêu dùng (CE) các

thiết bị như điện thoại thông minh, máy tính bảng, Smart

TV và Set-Top Box hiện có để phát lại độ nét cao (HD)

nội dung HEVC. Các giải pháp HEVC Ittiam của được trưng

bày tại CES 2013, MWC 2013 và NAB2013.

Ngày 03/04/2013, ATEME công bố sự sẵn có của việc thực

hiện mã nguồn mở đầu tiên của một cầu thủ phần mềm HEVC

dựa trên các bộ giải mã OpenHEVC và GPAC máy nghe nhạc

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 65

Page 66: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

video được cả hai cấp phép theo LGPL. Các OpenHEVC bộ

giải mã hỗ trợ Thông tin chính của HEVC và có thể giải

mã 1080p tại 30 fps video sử dụng một CPU lõi đơn. Một

bộ chuyển mã trực tiếp hỗ trợ HEVC và sử dụng kết hợp

với máy nghe nhạc video GPAC được trưng bày tại gian

hàng ATEME tại NAB Show vào tháng tư năm 2013.

Ngày 09/04/2013, SES công bố lần đầu tiên siêu truyền HD

sử dụng các tiêu chuẩn HEVC. Các truyền có độ phân giải

3840x2160 và tốc độ bit 20 Mbit/s. SES sử dụng PROMEDIA

Xpress HEVC mã hóa hài và BCM7445 HEVC bộ giải mã

Broadcom.

Ngày 09/05/2013, NHK và Mitsubishi Electric thông báo

rằng họ đã cùng nhau phát triển bộ mã hóa HEVC đầu tiên

cho 8K Ultra HD TV, còn được gọi là Super Hi-Vision

(SHV). Các bộ mã hóa HEVC hỗ trợ 10 profiles ở cấp độ

6.1 cho phép nó để mã hóa 10-bit video với độ phân giải

7680x4320 ở 60 fps. Các bộ mã hóa HEVC có 17 3G-SDI đầu

vào và sử dụng 17 bảng cho xử lý song song với mỗi bảng

mã hóa một hàng 7680x256 pixel để cho phép thời gian

thực mã hóa video. Các bộ mã hóa HEVC là phù hợp với dự

thảo 4 của tiêu chuẩn HEVC và có một tốc độ bit tối đa

340 Mbit/s. Các bộ mã hóa HEVC được trưng bày tại Phòng

thí nghiệm Khoa học & Công nghệ nghiên cứu NHK Open

House 2013 diễn ra từ 30/05 – 02/06. Tại NHK Open House

2013 bộ mã hóa HEVC sử dụng một tỷ lệ bit của 85 Mbit/s

mà đưa ra một tỷ lệ nén 350:1.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 66

Page 67: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Ngày 15/05/2013, DivX phát hành một phiên bản dự thảo

của profile video DivX HEVC được dựa trên main profile

và main tier của HEVC với hạn chế bổ sung cụ thể cho các

cấu hình video DivX HEVC. Các phiên bản dự thảo của DivX

HEVC 4K, độ phân giải 1080p, và cấu hình video 720p hiện

đang xác định chỉ có video DivX và đang có kế hoạch để

xác định các yếu tố khác của các cấu hình trong tương

lai. Hồ sơ video DivX HEVC 4K cho phép một tỷ lệ bit tối

đa HEVC Cấp 5.1 (40 Mbit / s) nhưng số lượng tối đa của

mẫu trong một giây được giới hạn HEVC Cấp 5 (4096x2160 ở

30 fps).

Ngày 31/05/2013, Orange công bố lần đầu tiên Public HEVC

demontration của một chuỗi thời gian thực cung cấp end-

to-end. Các bộ HEVC trình diễn bao gồm phát sóng độ nét

cao ở 2013 French Open từ 01/06 – 09/06 sử dụng cả IPTV

và DVB-T2. Các bộ HEVC trình diễn có thể được nhìn thấy

trong khu vực kỹ thuật của Orange và tại một phòng trưng

bày ở Rennes.

Ngày 04/06/2013, Tổng công ty Rovi phát hành MainConcept

HEVC SDK 1.0. SDK 1.0 hỗ trợ Công nghệ Mã Hóa Tốc độ Bít

thích ứng thông minh (Smart Adaptive Bitrate Encoding

Technology - SABET) mà cho phép mã hóa đồng thời lên đến

10 dòng bít đầu ra video với chi phí tính toán giảm. SDK

1.0 có sẵn cho Windows và SDK 1.0.1, sẽ được phát hành

vào tháng Bảy năm 2013, sẽ thêm hỗ trợ cho Linux và Mac

OS X. SDK 1.0 hỗ trợ tin chính trong khi SDK 2.0, sẽ

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 67

Page 68: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

được phát hành trong quý 4 năm 2013, sẽ hỗ trợ thêm cho

10 hồ sơ chính.

Ngày 10/06/2013, Vanguard video công bố hỗ trợ cho 10

main profiles đã được thêm vào V.265 để chuyên nghiệp mã

hóa HEVC của họ. V.265 là lần đầu tiên sử dụng phần mềm

HEVC mã hóa thời gian thực để hỗ trợ 10 main profiles.

Ngày 20/06/2013, Imagination Technologies đã công bố

PowerVR - bộ giải mã Series5 HEVC. Các bộ giải mã lõi

PowerVR D5500 hỗ trợ 10-bits trên một mẫu video giải mã.

Ngày 19/07/2013, Allegro DVT thông báo rằng họ đã được

cải thiện HEVC bộ giải mã IP của mình bằng cách thêm hỗ

trợ cho 10 main profiles.

Ngày 23/07/2013, MulticoreWare phát hành mã nguồn alpha

cho x265.

Ngày 08/08/2013, Nippon Telegraph and Telephone bố việc

phát hành HEVC-1000 mã hóa phần mềm SDK của họ hỗ trợ 10

main profiles, độ phân giải lên đến 7680x4320, và tỷ lệ

khung hình lên đến 120 fps.

Ngày 21/08/2013, Microsoft phát hành một DirectX Video

Acceleration (DXVA) đặc điểm kỹ thuật cho HEVC hỗ trợ hồ

sơ cá nhân chính, 10 main profiles và mail Still Picture

profiles. DXVA 2.0 là cần thiết để bộ giải mã HEVC tăng

được tốc độ phần cứng và bộ giải mã tương thích có thể

sử dụng DXVA 2.0 cho các hoạt động sau: phân tích

bitstream, deblocking, inverse quantization scaling,

inverse transform processing, and motion compensation.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 68

Page 69: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Ngày 04/09/2013, Ittiam Systems trình diễn bộ mã hóa

HEVC thời gian thực 1080p và và bộ giải mã 4K HEVC tại

IBC'13. Phần mềm mã hóa HEVC Ittiam trên nền tảng Intel

x86 hỗ trợ độ phân giải UHD và có khả năng mã hóa thời

gian thực cấp phát nội dung HD 1080p. Các bộ giải mã

phần mềm trên Intel và ARM CortexTM có khả năng thực

hiện giải mã thời gian thực 4K/UHD.

Ngày 11/09/2013, ViXS Systems công bố XCode 6400 SoC, hỗ

trợ độ phân giải 4K tại 60 fps, 10 main profiles của

HEVC, và không gian màu Rec. 2020.

Ngày 11/09/2013, NGCodec Inc công bố clip thử nghiệm 4K

HEVC/H.265 miễn phí.

Từ ngày 12 – 17/09/2013 IBC chương trình tại Amsterdam,

HEVC là một chủ đề quan trọng - với HEVC sản phẩm công

nghệ được chứng minh bởi một số công ty, bao gồm cả

Allegro DVT, Ateme, Broadcom, công nghệ lemental,

Envivio, Ericsson, Fraunhofer HHI, Fujitsu, Haivision,

Ittiam, Kontron, Truyền thông Excel, NGCodec Inc, NTT-

AT, NXP Software, Pace, Quickfire Networks Rovi /

MainConcept, SES, Squid Systems, STMicroelectronics,

Tata Elxsi, Technicolor, Telestream, Thomson video

Networks, Vanguard Video, VITEC và VisualOn.

Ngày 16/10/2013, các bộ giải mã OpenHEVC đã được thêm

vào FFmpeg.

Ngày 23/10/2013, Ittiam đã chứng minh bộ giải mã HEVC

năng lượng thấp tối ưu hóa cho bộ tính toán ARM Mali ™

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 69

Page 70: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

GPU và chip ARM Cortex ® ®-Một bộ xử lý ARM Techcon

2013. Bộ giải mã Ittiam HEVC đã được thiết kế để tận

dụng lợi thế của các tính năng đầy đủ của SoC trên điện

thoại di động, nó kết hợp sức mạnh tính toán và sử dụng

hiệu quả năng lượng tuyệt vời của GPU để giảm pin.

Ngày 29/10/2013, Elemental Technologies đã công bố hỗ

trợ cho bộ xử lý video thời gian thực 4K HEVC.

Elemental đã cung cấp video streaming trực tiếp cho

Osaka Marathon 2013 ngày 27/10/2013, trong một quy trình

làm việc được thiết kế bởi K-Opticom, một nhà điều hành

viễn thông tại Nhật Bản. Bảo hiểm trực tiếp của cuộc đua

trong 4K HEVC đã có sẵn để người xem tại Trung tâm triển

lãm quốc tế tại Osaka. Truyền này 4K HEVC video trong

thời gian thực là một ngành công nghiệp đầu tiên.

Ngày 14/11/2013, các nhà phát triển DivX công bố thông

tin về hiệu suất giải mã HEVC sử dụng một CPU i7 Intel

3,5 GHz trong đó có 4 lõi và 8 threads. Bộ giải mã DivX

10.1 Beta có khả năng lấy mẫu 210,9 fps ở 720p, 101.5

fps ở độ phân giải 1080p , và 29,6 fps ở 4K.

Ngày 18/12/2013, ViXS Systems thông báo lô hàng của họ

XCode 6400 SoC là SoC đầu tiên hỗ trợ 10 main profiles

của HEVC.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 70

Page 71: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

4.1.2.3 Năm 2014

4.1.3 Các profiles và levels của chuẩn HEVCĐể tạo điều kiện cho người sử dụng lựa chọn công cụ

H.265/HEVC, các thiết bị được chia thành các version và

các nhóm công cụ (profiles) khác nhau. Mỗi profile lại

có các mức levels khác nhau thể hiện mức độ phức tạp xử

lý tính toán dữ liệu của công cụ đó (thông qua việc xác

định tốc độ bit, con số tối đa của các đối tượng trong

frame, độ phức tạp của quá trình giải mã audio..).

4.1.3.1 Các profilesH.265/HEVC định nghĩa các nhóm profiles như sau :

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 71

Page 72: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

4.1.3.2 Các levelsTrong H.264/AVC định nghĩa 12 level xác định các

giới hạn trên cho kích thước ảnh, tốc độ xử lý, kích

thước vùng nhớ đệm, tốc độ bit video…

Levelnumber

Max lumasample rate(samples/s)

Max lumapicture size(samples)

Max bit rate for Mainand Main 10 profiles (kbit/s)(Main tier)

Max bit rate for Mainand Main 10 profiles (kbit/s)(High tier)

xample pictureresolution @

highest frame rate(MaxDpbSize)

1 552,960 36,864 128 kbit/s - [email protected] (6)[email protected] (6)

2 3,686,400 122,880 1,500kbit/s - [email protected] (16)

[email protected] (6)

2.1 7,372,800 245,760 3,000kbit/s - [email protected] (12)

[email protected] (6)

3 16,588,800 552,960 6,000

kbit/s - [email protected](12)[email protected] (8)[email protected] (6)

3.1 33,177,600 983,040 10,000kbit/s -

[email protected](12)[email protected]

(8)[email protected] (6)

4 66,846,720 2,228,224 12,000kbit/s

30,000kbit/s

1,[email protected](12)1,920x1,080@32.

0 (6)2,048x1,[email protected]

(6)4.1 133,693,440 2,228,224 20,000

kbit/s50,000kbit/s

1,920x1,[email protected](16)

3,840x2,[email protected]

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 72

Page 73: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

(6)4,096x2,[email protected]

(6)

5 267,386,880 8,912,896 25,000kbit/s

100,000kbit/s

1,920x1,[email protected](16)

3,840x2,[email protected](6)

4,096x2,[email protected](6)

5.1 534,773,760 36,8648,912,896

40,000kbit/s

160,000kbit/s

1,920x1,[email protected](16)

3,840x2,[email protected](6)

4,096x2,[email protected](6)

5.2 1,069,547,520

8,912,896 60,000kbit/s

240,000kbit/s

1,920x1,[email protected](16)

3,840x2,[email protected](6)

4,096x2,[email protected](6)

6 1,069,547,520

35,651,584 60,000kbit/s

240,000kbit/s

3,840x2,[email protected](16)

7,680x4,[email protected](6)

8,192x4,[email protected](6)

6.1 2,139,095,040

35,651,584 120,000kbit/s

480,000kbit/s -

3,840x2,[email protected](16)

7,680x4,[email protected](6)

8,192x4,[email protected](6)

6.2 4,278,190,080

35,651,584 240,000kbit/s

800,000kbit/s

3,840x2,[email protected](16)

7,680x4,[email protected](6)

8,192x4,[email protected](6)

Với khả năng truyền video với chất lượng cao với

bitrate chỉ bằng một nửa so với H.264, H.265 hứa hẹn sẽ

phổ biến trong tất cả các ứng dụng trong vòng 10 năm tới

đây.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 73

Page 74: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

4.2 Kĩ thuật nén video HEVC

4.2.1 Giải thích hoạt động cơ bảnNhư đã nói ở trên mục tiêu chính của việc nghiên cứu và

phát triển tiêu chuẩn H.265/HEVC là cho phép cải thiện

đáng kể hiệu suất nén tương đối so với các tiêu chuẩn

trước đó trong khoảng từ giảm tốc độ bit 50% và cho

chất lượng video cảm nhận bằng các tiêu chuẩn hiện có.

Bên cạnh đó HEVC đã được thiết kế để giải quyết về cơ

bản tất cả các ứng dụng hiện có sử dụng H.264 / MPEG-4

AVC và đặc biệt là tập trung vào hai vấn đề chính:

Độ phân giải video tăng

Tăng cường sử dụng kiến trúc xử lý song song.

Vậy chúng ta sẽ đặt ra câu hỏi là nếu tốc độ bit thực sự

được giảm đi một nửa thì có thể sẽ có những chuyện gì

xảy ra. Thực sự sẽ có những sự thay đổi lớn trong các

ứng dụng và thiết bị đang sử dụng các chuẩn nén video

trước đó.

IPTV qua DSL: sự thay đổi lớn trong điều kiện IPTV

Tạo điều kiện triển khai các OTT và màn hình đa

dịch vụ

Nhiều khách hàng trên cơ sở hạ tầng như nhau: hầu

hết các lưu lượng IP là video

Nhiều phương tiện lưu trữ

Và H.265/HEVC sẽ đi tiên phong và chiếm lĩnh công nghệ

trong các dịch vụ trong tương lai

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 74

Page 75: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

1080p60 / 50 với bitrate so sánh với 1080i

Trải nghiệm xem video siêu nét và siêu thực: Ultra-

HD (4K, 8K)

Dịch vụ Premium (thể thao, nhạc sống, các sự kiện

trực tiếp, ...): nhà hát, điện thoại di động

HD TV 3D Full khung cho mỗi lần xem với tốc độ

delivery HD hiện nay

Để đạt được những mục tiêu kể trên, cũng như hầu hết các

thiết kế của các tiêu chuẩn mã hóa video trước đó thì

những thiết kế của HEVC chủ yếu nhằm mục đích mã hóa

video có hiệu quả cao nhất.

Mã hóa hiệu quả (efficiency coding) là khả năng mã

hóa video với tốc độ bit thấp nhất có thể trong khi duy

trì một mức độ chất lượng video. Có hai phương pháp tiêu

chuẩn để đo lường hiệu quả việc mã hóa của một video mã

hóa tiêu chuẩn, trong đó có sử dụng một số liệu khách

quan, chẳng hạn như tỷ số tín hiệu đỉnh trên nhiễu (peak

signal-to-noise ratio - PSNR), hoặc sử dụng đánh giá chủ

quan về chất lượng video. Đánh giá chủ quan của chất

lượng video được coi là cách quan trọng nhất để đo lường

một tiêu chuẩn mã hóa video kể từ khi con người nhận

thức chất lượng video chủ quan.

Những lợi ích của HEVC đến từ việc sử dụng cây Mã

hóa đơn vị (Coding Tree Unit - CTU) cỡ lớn. Điều này đã

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 75

Page 76: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

được chứng minh trong các thử nghiệm PSNR với HM-8.0 mã

hóa HEVC nơi nó bị buộc phải sử dụng kích thước CTU dần

dần nhỏ hơn. Đối với tất cả các bài kiểm tra tuần tự,

khi so sánh với một CTU kích thước 64x64 nó đã chỉ ra

rằng tỷ lệ bit HEVC tăng 2,2% khi buộc phải sử dụng một

CTU kích thước 32x32 và tăng 11,0% khi buộc phải sử dụng

một CTU kích thước 16x16. Trong bài kiểm tra tuần tự

Class A, trong đó độ phân giải của video là 2560x1600,

khi so sánh với một CTU kích thước 64x64 người ta thấy

rằng tốc độ bit HEVC tăng 5,7% khi buộc phải sử dụng một

CTU kích thước 32x32 và tăng 28,2% khi buộc phải sử dụng

một CTU kích thước 16x16. Các thử nghiệm cho thấy CTU

kích thước lớn làm tăng mã hóa hiệu quả đồng thời cũng

giảm thời gian giải mã.

HEVC main profile (MP) đã được so sánh trong mã hóa hiệu

quả để H.264/MPEG-4 AVC High Profile (HP), MPEG-4

Advandce Simple Profile (ASP), H.263 High Latency

Profile (HLP), và H .262/MPEG-2 Main Profile (MP). Các

video mã hóa đã được thực hiện cho các ứng dụng giải trí

và 12 bitrates khác nhau đã được thực hiện trong chín

đoạn video kiểm tra tuần tự với một bộ mã hóa HEVC HM-

8.0 được sử dụng. Trong số chín video thử nghiệm tuần tự

này, năm video ở độ phân giải HD trong khi bốn là ở độ

phân giải WVGA (800x480). Việc cắt giảm tỷ lệ bit cho

HEVC được xác định dựa trên PSNR.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 76

Page 77: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Comparison of video coding standards based on equal PSNR for

entertainment applications

HEVC MP cũng đã được so sánh với H.264/MPEG-4 AVC

HP cho chất lượng video chủ quan. Các video mã hóa đã

được thực hiện cho các ứng dụng giải trí và 4 bitrates

khác nhau đã được thực hiện trong chín video kiểm tra

tuần tự với bộ mã hóa HM-5.0 HEVC được sử dụng. Các đánh

giá chủ quan đã được hoàn thành vào một ngày sớm hơn so

với việc so sánh PSNR và do đó nó đã được sử dụng một

phiên bản cũ của bộ mã hóa HEVC phiên bản mà có hiệu

suất thấp hơn một chút. Việc cắt giảm tỷ lệ bit được xác

định dựa trên đánh giá chủ quan sử dụng những giá trị

mean opinion score. Việc giảm bitrate chủ quan tổng thể cho

HEVC MP so với H.264/MPEG-4 AVC HP là 49,3%.

École Polytechnique Fédérale de Lausanne (EPFL) đã

làm một nghiên cứu để đánh giá chất lượng video chủ quan

của HEVC ở độ phân giải cao hơn so với HDTV. Nghiên cứu

được thực hiện với 3 video với độ phân giải 3840x1744 ở

tốc độ 24 fps, 3840x2048 ở tốc độ 30 fps, và 3840x2160 ở

tốc độ 30 fps. Các cảnh quay video thứ hai cho thấy

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 77

Page 78: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

người dân trên một đường phố, giao thông, và một cảnh từ

mã nguồn mở máy tính hoạt hình phim Sintel . Các đoạn

video này lần lượt được mã hóa ở năm bitrate khác nhau

bằng cách sử dụng bộ mã hóa HM-6.1.1 HEVC và bộ mã hóa

JM-18.3 H.264/MPEG-4 AVC. Việc giảm bitrate chủ quan

được xác định dựa trên đánh giá chủ quan bằng cách sử

dụng những giá trị mean opinion score. Các nghiên cứu so

sánh HEVC MP với H.264/MPEG-4 AVC HP và chỉ ra rằng với

HEVC MP sử dụng công nghệ giảm bitrate trung bình dựa

trên PSNR là 44,4%, trong khi sử dụng công nghệ giảm

bitrate trung bình dựa trên chất lượng video chủ quan là

66,5%.

Trong một cuộc so sánh hiệu suất của HEVC được

phát hành vào tháng Tư năm 2013, HEVC MP và main 10 Profile

(M10P) được so sánh với H.264/MPEG-4 AVC HP và High 10

Profile (H10P) sử dụng chuỗi video có độ phân giải

3840x2160. Các đoạn là mã hóa bằng cách sử dụng bộ mã

hóa HEVC HM-10,0 và bộ mã hóa JM-18.4 H.264/MPEG-4 AVC.

Việc giảm tốc độ bit trung bình dựa trên PSNR là 45% cho

video liên khung.

Trong một cuộc so sánh các bộ mã hóa video được

phát hành vào tháng 12 năm 2013. Bộ mã hóa HEVC HM-10.0

được so sánh với bộ mã hóa x264 và bộ mã hóa VP9. Các bộ

mã hóa x264 là phiên bản r2334 và các bộ mã hóa VP9 là

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 78

Page 79: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

phiên bản v1.2.0-3088-ga81bd12. Sự so sánh sử dụng lý

thuyết đo lường Bjøntegaard-Delta Bit Rate (BD-VN) để đo lường

trong đó các giá trị Negative là độ suy giảm tốc độ bít

với cùng một giá trị của PSNR, giá trị Positive là độ gia

tăng tốc độ bít với cùng một giá trị tỷ số PSNR. Trong

so sánh đó bộ mã hóa HM-10.0 HEVC có hiệu quả mã hóa và

trung bình cao nhất để có được một video cùng chất lượng

như vậy các bộ mã hóa x264 cần thiết phải tăng tốc độ

bit lên 66,4%, trong khi bộ mã hóa VP9 cần thiết phải

tăng tốc độ bit lên 79,4%.

Comparison of video encoders based on equal PSNR using the BD-

BR method

4.2.2 Cấu trúc Mã hóa (Coding Structure)HEVC đã thay thế macroblocks, được sử dụng với tiêu

chuẩn trước đó, bằng cấu trúc mã hoá cây đơn vị (Coding

Tree Units - CTUs) và cấu trúc mã hóa khối cây (Coding

Tree Block - CTB). Việc sử dụng cấu trúc CTUs đã làm cho

HEVC gia tăng đáng kể hiệu quả mã hóa. HEVC ban đầu chia

hình ảnh thành 3 CTB:

1 luma CTB

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 79

Page 80: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

2 chroma CTB

Kích thước L x L của một luma CTB có thể được chọn là L

= 16, 32, hoặc 64 mẫu, với các kích thước lớn hơn thường

cho phép nén tốt hơn.HEVC còn hỗ trợ phân vùng của CTBs

thành các khối nhỏ hơn.

Quad-tree

Trong công nghệ HEVC thì CUs là đơn vị dự đoán cơ bản.

CUs có thể là 64x64, 32x32, 16x16 hoặc 8x8.

Khối dự đoán Prediction

Trong HEVC việc quyết định về mã một khu vực hình ảnh sử

dụng interpicture hoặc intrapicture, các dự đoán được

thực hiện ở cấp CU. CUs sau đó có thể được chia thêm

kích thước thành các khối dự đoán (PBs). HEVC hỗ trợ

kích thước PB biến từ 64 × 64down 4 × 4 mẫu.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 80

Page 81: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Chế độ để tách một CB thành những PBs, tùy thuộc vào

kích thước hạn chế nhất định. Đối với dự đoán

intrapicture CBs, chỉ có M × M và M / 2 × M / 2 được hỗ

trợ.

Intra prediction

HEVC quy định cụ thể chế độ 33 hướng để dự đoán nội

so với chế độ 8 hướng cho Intra prediction theo quy định

của H.264/MPEG-4 AVC. HEVC cũng quy định về Intra

prediction đẳng hướng. Các chế độ Intra prediction sử dụng dữ

liệu lấy từ khối dự đoán lân cận đã được giải mã từ

trước.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 81

Page 82: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Các bộ Biến đổi- Transform design

HEVC xác định bốn khối biến đổi đơn vị (Transform

Units - TUs) kích thước là 4x4, 8x8, 16x16, 32x32 để

mã hóa dự đoán dư thừa. Một CTB có thể được đệ quy

chia thành 4 hoặc nhiều hơn 4 TUs. TUs sử dụng nhưng

hàm số nguyên cơ bản như là Hàm cosin rời rạc (DCT).

Ngoài ra những khối chuyển đổi luma 4x4 thuộc về một

khu vực mã hóa nội bộ (Intra Prediction) được biến

đổi bằng cách sử dụng một số nguyên chuyển đổi mà có

nguồn gốc từ hàm sin rời rạc (DST). Nó cung cấp một tỷ

lệ suy giảm bit là 1% nhưng bị hạn chế ở khối biến đổi

luma 4x4 do lợi ích cận biên trong các trường hợp biến

đổi khác. Màu sắc sử dụng ứng với cùng một kích thước

trong luma cũng giống như trong TUs vì vậy không có

2x2 biến cho màu sắc.

Bộ lượng tử hóa- quantisation design

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 82

Page 83: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

HEVC cũng sử dụng các bộ lượng tử hóa tương tự như

H.264/AVC nhưng mở rộng hỗ trợ cho các ma trận chuyển đổi

kích thước khối khác nhau.

Dự đoán vector chuyển động (Motion vector Prediction)

HEVC định nghĩa một ký trong khoảng 16-bit cho

vector chuyển động theo cả hai chiều ngang và theo

chiều dọc (MVs). Nó được cập nhật cho HEVC tại tháng 7

năm 2012 HEVC cuộc họp với các biến mvLX. Các vector

HEVC ngang / dọc MVs có một loạt các -32.768-32.767 mà

cho các điểm ảnh quý chính xác được sử dụng bởi HEVC

cho phép một loạt MV của mẫu luma từ 8.192 8191,75.

So với H.264/MPEG-4 AVC cho phép cho các mẫu luma của

vector theo chiều dọc trong phạm vi từ 512 đến 511,75

và theo chiều ngang trong phạm vi từ 2.048

2047,75.

HEVC cho phép hai chế độ MV là Advanced Motion

Vector Prediction (AMVP) và chế độ hợp nhất (Merge

Mode). AMVP sử dụng dữ liệu từ các hình ảnh tham khảo

và cũng có thể sử dụng dữ liệu từ khối dự đoán lân

cận.Merge Mode cho phép các MVs để kế thừa từ khối dự

đoán lân cận.Merge Modes trong HEVC là tương tự như

các Modes chuyển động "Skipped" và "Direct" trong

H.264/MPEG-4 AVC nhưng với điểm hai cải tiến. Cải tiến

đầu tiên là HEVC sử dụng thông tin chỉ số để lựa chọn

một trong số các ứng cử viên có sẵn.Cải tiến thứ hai

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 83

Page 84: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

là HEVC sử dụng thông tin từ danh sách hình ảnh tham

khảo và chỉ số hình ảnh tham khảo.

Mã hóa Entropy

HEVC sử dụng một thuật toán học nhị phân thích

ứng ngữ cảnh (Context-Adaptive Binary Arithmetic

Coding - CABAC) cái mà về cơ bản là tương tự như CABAC

trong H.264/MPEG-4 AVC. CABAC chỉ là lý thuyết mã hóa

Entropy được sử dụng trong HEVC trong khi có hai bộ mã

hóa Entropy được sử dụng trong H.264/MPEG-4 AVC. CABAC

và mã hóa Entropy của hệ số biến đổi trong HEVC được

thiết kế cho Throughput cao hơn so với H.264/MPEG-4

AVC. Ví dụ, số lượng ngữ cảnh đã được mã hóa giảm 8x

và CABAC ở chế độ Bypass-Mode đã được cải thiện về

thiết kế của nó để tăng Throughput. Một cải tiến khác

với HEVC đó là sự phụ thuộc giữa các dữ liệu được mã

hóa đã được thay đổi để tăng thêm Throughput.Lấy mẫu

theo ngữ cảnh trong HEVC cũng đã được cải thiện do đó

CABAC có thể chọn một bối cảnh tốt hơn cái mà làm tăng

hiệu suất khi so sánh với H.264/MPEG-4 AVC.

Bộ lọc lặp (Deblocking Filter - DBF)

Về cơ bản thì HEVC sử dụng các bộ lọc tương tự như

H,264/AVC. Bên cạnh đó, HEVC xác định hai bộ lọc lặp

được áp dụng một cách tuần tự, với các bộ lọc deblocking

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 84

Page 85: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

(DBF) đã áp dụng đầu tiên và thích nghi mẫu bù đắp (SAO)

áp dụng bộ lọc sau đó. Cả hai bộ lọc vòng lặp được áp

dụng trong dự đoán vòng lặp liên hình ảnh, tức là lọc

hình ảnh được lưu trữ trong bộ đệm hình ảnh giải mã

(DPB) như là một tài liệu tham khảo để dự đoán liên hình

ảnh.

Chương 5. Những điểm tối ưu của HEVC so với H.264/AVC

5.1 Sự tối ưu trên lý thuyết.265/HEVC hứa hẹn đánh dấu một bước ngoặt mới trong

lĩnh vực nén video, nhờ áp dụng các kỹ thuật tiên

tiến nhằm mục đích sử dụng băng thông hiệu quả hơn và

đem lại chất lượng ảnh cao hơn và độ trễ thấp. Với các

kỹ thuật này, H.265/HEVC có thể đem lại nhiều hiệu quả

hơn so với chuẩn H.264/AVC hiện đang được sử dụng rộng

rãi.

H

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 85

Page 86: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Như đã nói ở trên, mục tiêu của HEVC là giảm 1 nửa

bitrate so với AVC mà vẫn đạt chất lượng tương đương.

Tùy thuộc vào yêu cầu của ứng dụng, HEVC có thể tăng tỉ

số nén, độ phức tạp trong khi encode trong khi tỉ lệ lỗi

và độ trễ giảm. HEVC là mục tiêu của các HDTV thế hệ

tiếp theo, các máy ảnh và máy quay phim, với độ phân

giải hỗ trợ từ 320x240 QVGA đến 8K UHD 7680 × 4320, cũng

như cải thiện chất lượng hình ảnh, giảm SNR, tăng gam

màu và độ tương phản động. HEVC thay thế macroblocks với

một hệ thống linh hoạt linh hoạt dựa trên các đơn vị mã

hóa (CU - Coding Unit), biến macroblock hình thành các

vùng hình chữ nhật. Mỗi CU chứa đơn vị dự đoán thay đổi

kích thước bằng các phép toán nôi suy trong khung hình

hoặc phép toán nỗi suy giữa các khung hình, trong khi đó

các đơn vị chuyển đổi chứa các hệ số biến đổi không gian

và lượng tử hóa.

Bạn có thấy sự khác biệt nào trong bức tranh này:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 86

Page 87: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Những điểm khác nhau chính giữa H.265/HEVC và H.264/AVC

được thể hiện cụ thể như bảng dưới đây:

H.264/AVC HEVC Partition

size

Macroblock 16x16 (Large) Coding Unit

8x8 to 64x64 Partitionin

g

Sub-block down to

4x4

Prediction Unit

Quadtree down to

4x4

Square, symmetric

and

asymmetric

(only square for

intra) Transform Integer DCT 8x8,

4x4

ransform Unit

square

IDCT from 32x32 to

4x4

+ DST Luma Intra

4x4 Intra

prediction

Up to 9 predictors Up to 9 predictors

Cụ thể là :

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 87

Page 88: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

5.2 Sự khác biệt qua mô phỏng với hình ảnh cụ thểChúng ta sẽ đưa ra 4 bức ảnh với các thông số khác nhau

và mô phỏng bởi 2 chuẩn HEVC và H.264/AVC để thấy sự

khác biệt. 4 hình ảnh được sử dụng đó là :

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 88

Page 89: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Ảnh 1: Hoạt động ở bờ biển, nhiều hoạt động, sự dư thừa

không gian bình thường.

Ảnh 2: Anh kĩ sư, sự dư thừa không gian cao, hoạt động

thấp .

Ảnh 3: Ảnh từ điện thoại, sự dư thừa thấp, hoạt động

cao.

Ảnh 4: Chương trình thời sự, hoạt động thấp, sự dư thừa

cao.

Qua mô phỏng ta thu được kết quả như sau:

5.2.1 Trong H.264/AVC Tỷ lệ tín hiệu trên nhiễu

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 89

Page 90: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

0 2000 4000 6000 80002030405060 H.264 PSNR-bitrate

Foreman

Bitrate [kbit/s]

PSNR

[dB]

Bức ảnh có tỉ lệ tốt nhất để có chất lượng cao là ảnh 4

chương trình thời sự, vì nó có mức hoạt động thấp và sự

dư thừa cao. Và bức ảnh đem lại chất lượng nén kém nhất

là ảnh từ điện thoại vì nó có mức hoạt động cao của cả

đối tượng và của cả hình nền.

Tốc độ bít

0 2000 4000 6000 8000150200250300350400

H.264 time/bit-rate

foreman

Bitrate [kbit/s]

Time

[s]

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 90

Page 91: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Ta thấy rằng ngoại trừ ảnh 4 thì các bức ảnh còn lại có

tốc độ bít gần như giống nhau bởi vì các frames ở các

bức ảnh là tương tự nhau.

Giới hạn độ tăng ích

0 1000 2000 3000 4000 500030

35

40

45

50 Comparison search range

foreman- SR 32foreman-SR 64

Bitrate [kbit/s]

PSNR

[dB

]

0 1000 2000 3000 4000 500025

30

35

40

45 Comparison search range

coastguard- SR 32coastguard-SR 64

Bitrate [kbit/s]

PSNR

[dB

]

Khi thực hiện kiểm tra với tất cả các bức ảnh ở trên ta

thấy rằng không có bức hình nào có giới hạn tăng ích cao

cả. Có thể nguyên nhân chính là vị tính hoạt động trong

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 91

Page 92: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

các bức hình trên là không đủ cao ở mức Sr 32 để hiển

thị tất cả các hoạt động.

5.2.2 Trong HEVC

Tỷ lệ tín hiệu trên nhiễu

0 1000200030004000500060007000800020

30

40

50

60HEVC frame 300 GOP BBBBBBBB

foremancoastguardmobilenews

Bitrate [kbit/s]

PSNR

[dB

]

Ta thấy rằng kết quả là tương tự như trong H.264/AVC,

hiệu quả nén tốt nhất thuộc về hình ảnh có mức hoạt động

thấp nhất và độ dư thừa cao nhất.

Tốc độ bít

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 92

Page 93: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

0 2000 4000 6000 80000

50010001500200025003000 HEVC frame 300 GOP BBBBBBBB

Foremancoastguardmobilenews

Bitrate [kbit/s]

Time

[s]

Ở đây chúng ta thấy một sự biến đổi rất lớn về tốc độ

bít theo thời gian khác hẳn với H.264/AVC. Vì HEVC được

mã hóa rất phức tạp nên ta không thể thấy được bất kì

mối liên hệ nào giữa độ dư thừa hay mức hoạt động so với

tốc độ bít cả.

Intra-period gain

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 93

Page 94: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

01000

2000

3000

4000

5000

6000

7000

8000

2530354045505560

HEVC frame 300 ItraPeriod -1 vs 32

foreman- ItntraPeriod -1

Bitrate [kbit/s]

PSNR

[dB

]

0 2000 4000 6000 800024293439444954 HEVC frame 300 IntraPeriod -1

vs 32

coastguard-ItntraPeriod -1

Bitrate [kbit/s]

PSNR

[dB

]

Ở đây ta thấy rằng khi thêm các intra-reference frames

thì làm giảm đáng kể chất lượng nén của hình ảnh với

cùng một tỷ lệ bit, bởi vì intra-frames cung cấp mức nén

thấp hơn so với khung hình trong ảnh 2(anh kĩ sư-

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 94

Page 95: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

foreman) và mã hóa của chúng ta cần sử dụng các yếu tố

lượng tử cao hơn. Nó làm giảm đáng kể trở kháng truyền

tải trong lỗi kênh truyền, nhưng trong mô phỏng này đã

được thực hiện với việc sử dụng kênh truyền không có

lỗi.

Giới hạn độ tăng ích

0 2000 4000 6000 80002025303540455055

GOP 8xB Search Range Comparison

mobile SR 32mobile-SR 64mobile SR full

Bitrate [kbit/s]

PSNR

[dB

]

Cũng như H.264/AVC khi thực hiện kiểm tra với tất cả các

bức ảnh ở trên ta thấy rằng không có bức hình nào có

giới hạn tăng ích cao cả. Có thể nguyên nhân chính là vị

tính hoạt động trong các bức hình trên là không đủ cao ở

mức Sr 32 để hiển thị tất cả các hoạt động.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 95

Page 96: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

0 2000 4000 6000 800020

220

420

620

820

1020GOP 8xB Search Range

Comparison

mobile SR 32mobile-SR 64mobile SR full

Bitrate [kbit/s]

Time

[s]

Như ở trên thì thấy rằng không có sự khác biệt nào về

giới hạn tăng ích của các bức ảnh trên ở các chế độ khác

nhau. Nhưng khi thời gian tăng lên ở một mức tương đối

lơn ( > 400s) thì sự khác biệt bắt đầu thấy rõ rệt. Đây

chỉ là một ý tưởng kiểm tra dựa trên những bức ảnh hiện

có. Không đề xuất thành lý thuyết cho các bức ảnh khác.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 96

Page 97: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

5.2.3 So sánh HEVC và H.264/AVC

0 2000 4000 6000 800029

34

39

44

49

54

59

Comparison 300 frames 8xB IDR

H264-Foreman

Bitrate [kbit/s]

PSNR [dB]

0 2000 4000 6000 8000150200250300350400450500550600

Comparison 300 frames 8xB IDR

HEVC-Foreman

Bitrate [kbit/s]

Time [s]

Chúng ta có thể thấy rằng HEVC có khả năng mã hóa là tốt

hơn rất nhiều so với tiêu chuẩn h.264. Ta thấy rằng sự

khác biệt vào khoảng 2 dB. Điều này có nghĩa rằng nó

cung cấp chất lượng tốt hơn gần như 50% so với h.264.

Tuy nhiên thời gian mã hóa cho HEVC là khủng khiếp so

với h.264. Đôi khi h.264 là nhanh hơn khoảng hai lần.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 97

Page 98: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

0 2000 4000 6000 800024

29

34

39

44

49

54

Comparison 300 frames IBBBBBBB

IDR

H264-coastguard

Bitrate [kbit/s]

PSNR [dB]

0 2000 4000 6000 80000

500

1000

1500

2000

2500

3000

Comparison 300 frames IBBBBBBB

IDR

HEVC-coastguardH264-coastguard

Bitrate [kbit/s]

Time

Ở đây chúng ta nhận thấy rằng độ tăng ích – gain của

H.264 chỉ thấp hơn một chút, nhưng sự khác biệt về thời

gian thực sự rất lớn, HEVC mất quá nhiểu thời gian. Về

nguyên nhân chúng ta có thể thấy rằng các bức ảnh chúng

ta sử dụng có mức hoạt động rất lớn cho nên chúng cần

một sự tính toán rất nhiều từ HEVC. Và vì HEVC quá phức

tạp, có rất nhiều tính toán cần phải được thực hiện, và

vì nó có rất nhiều lựa chọn cần xem xét hơn h.264.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 98

Page 99: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

0 2000 4000 6000 800024

29

34

39

44

49

54

Comparison 300 frames IBBBBBBB

IDR

HEVC-mobileH264-mobile

Bitrate [kbit/s]

PSNR [dB]

0 2000 4000 6000 80000

100

200

300

400

500

600

Comparison 300 frames IBBBBBBB

IDR

H264-mobileHEVC-mobile

Bitrate [kbit/s]

Time [s]

Trong ví dụ này chúng ta có thể thấy rằng đối với tốc độ

bit rất thấp HEVC và h.264 cung cấp gần như cùng một

chất lượng, nhưng thời gian của HEVC là nhanh hơn rất

nhiều. Kể từ 400kbit / s HEVC tăng về 1,5-2dB của PSNR

so với H.264

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 99

Page 100: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

0 2000 4000 600024293439444954596469

Comparison 300 frames IBBBBBBB

IDR

HEVC-news

Bitrate [kbit/s]

PSNR [dB]

0 2000 4000 60000

500

1000

1500

2000

2500

Comparison 300 frames IBBBBBBB

IDR

H264-NEWSHEVC-news

Bitrate[kbit/s]

Time [s]

Trong ví dụ này ta lại thấy rằng HEVC đòi hỏi một thời

gian xử lý cao hơn rất nhiều so với H.264/AVC. Tuy nhiên

ở hình bên trái ta thấy rằng HEVC vẫn cho một mức PSNR

cao hơn H.264 khi tốc độ bit tăng.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 100

Page 101: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

TÀI LIỆU THAM KHẢO[1] TS. Nguyễn Thanh Bình, Ths. Võ Nguyễn Quốc Bảo, “Xử

lý âm thanh, hình ảnh”, Học viện công nghệ Bưu chính viễn thông,

Hà Nội.

[2] KS. Trương Thị Thủy, “Tiêu chuẩn mã hóa tiên tiến

H.264-MPEG-4 AVC”, Tạp chí khoa học kỹ thuật truyền hình 1/2004.

[3] KS. Cao Văn Liết, “Bù chuyển động trong kỹ thuật mã

hóa nội dung nguồn video tự nhiên sử dụng tiêu chuẩn nén

MPEG-4”, Tạp chí khoa học kỹ thuật truyền hình 1/2005.

[4]Th.S. Nguyễn Minh Hồng, “Chuẩn nén H.264/AVC và khả

năng ứng dụng trong truyền hình”, Tạp chí khoa học kỹ thuật

truyền hình 2/2005.

[5] Gs.TS. Nguyễn Kim Sách, “Truyền hình số có nén và

Multimedia”, Nhà xuất bản khoa học kỹ thuật, Hà Nội

[6] TS. Trần Dũng Trình, “Truyền hình trên Internet

IPTV”, Tạp chí khoa học kỹ thuật truyền hình 3/2005

[7] Iain E. G. Richardson, “H.264 And MPEG-4 Video

Compression”, The Robert Gordon University, Aberdeen, UK

[8] John Arnold, Michael Frater, Mark Pickering,

“Digital Television Technology and Standards”, The

University of New South Wales, ADFA Canberra, ACT, Australia

[9] JVT “Draft ITU-T recommendation and final draft

international standard of joint

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 101

Page 102: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

video specification (ITU-T rec. H.264– ISO/IEC 14496-10

AVC),”

[10] THOMAS SIKORA, “MPEG-1 and MPEG-2 Digital Video

Coding Standards”, McGraw Hill Publishing Company.

[11] T. Wiegand, G.J. Sullivan, G. Bjontegaard, A.

Luthra, ”Overview of the H.264/AVC Video Coding

Standard,”

[12] Siwei Ma, Xiaopeng Fan, Wen Gao, “Low Complexity

Integer Transform and High Definition Coding”

[13] ITU. 2013-06-07, “H.265 : High efficiency video

coding” Retrieved 2013-06-07

[14] “Overview of the High Ef ciency Video Codingfi

(HEVC) Standard” Gary J. Sullivan, Fellow, IEEE, Jens-

Rainer Ohm, Member, IEEE, Woo-Jin Han, Member, IEEE, and

Thomas Wiegand, Fellow, IEEE

[15] Các trang web : http://google.com,

http://mathexchange.com http://forum.doom9.org,

University of Illinois at Chicago (UIC),

http://www.uic.edu/

http://www.chiariglione.org/mpeg/,

http://en.wikipedia.org

http://www.mathworks.com/,

http://media.xiph.org/video/derf/

http://www.stanford.edu/class/ee398b/samples.html

http://en.wikipedia.org/wiki/H.264/MPEG-4_AVC

Lecture slides of subject Equipos Multimedia

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 102

Page 103: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Tema 11: Estándar d e compresión de vídeo H.264

ITU-T Recommendations: H.264 : Advanced video coding for

generic audiovisual services

http://www.itu.int/rec/T-REC-H.264-201201-S/en

“THE H.264 ADVANCED VIDEO COMPRESSION STANDARD” Iain

Richardson [6.5.0-6.5.4];[7.4]

http://www.worldbroadcastingunions.org/wbuarea/library/

docs/isog/presentations/2012B/2.4%20Vieron%20ATEME.pdf

BẢNG ĐỐI CHIẾU THUẬT NGỮ VIỆT – ANH

STT Thuật ngữ tiếng Anh Thuật ngữ tiếng Việt

1HEVC Chuẩn nén Video hiệu

suất cao (High EfficiencyVideo Coding)

2VCEG Nhóm chuyên gia về mã

hóa Video (Video CodingExperts Groups)

3 BAC Mã hóa số học nhị phân(Binary Arithmetic Coding)

4 CA Mã hóa thích nghi theo

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 103

Page 104: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

nội dung (Context Adaptive)5 CC Mã xóa (Clear code)

6CIF Định dạng mã hóa hình

ảnh có kích thước 352 x288 (Common IntermediateFormat)

7 DAB Phát quảng bá âm thanhsố (Digital Audio Broadcasting)

8 DCT Biến đổi Cosine rời rạc(Discrete Cosine Transform)

9 DFT Biến đổi Fourier rời rạc(Discrete Fourier Transform)

10DPCM Điều xung mã vi sai

(Differential Pulse CodeModulation)

11 DS Thuật toán tìm kiểu hìnhthoi (Diamond Search)

12 DTH

13 DWT Biến đổi Wavelet rời rạc(Discrete Wavelet Transform)

14 EOI Mã kết thúc (End OfInformation)

15 ES Dòng cơ bản (ElemenataryStream)

16 Exp-Golomb Mã Exponential Golomb

17 FLC Mã hóa có chiều dài cốđịnh (Fixed-Length Code)

18 FMO Thứ tự MB mềm dẻo (FlexibleMacroblock Order)

19 GOP Nhóm ảnh (Group Of Pictures)

1 GMC Bù chuyển động toàn phần(Global Motion Compensation)

2HDS Thuật toán tìm hình thoi

nằm ngang (HorizontalDiamond search)

3 HDTV Truyền hình phân giải

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 104

Page 105: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

cao (High Definition Television)

4HEXBS Thuật toán tìm kiểu hình

lục giác (Hexagon-BasedSearch)

5ICT Biến đổi nguyên Cosine

rời rạc (Integer DiscreteCosine Transform)

6IDR Ảnh làm tươi tức thời bộ

giải mã (InstantaneousDecoder Refresh Picture)

7IDCT Biến đổi ngược Cosine

rời rạc (Inverse DiscreteCosine Transform)

8 IP Giao thức Internet( Internet Protocol)

9ISDN Mạng tích hợp dịch vụ số

(Integrated Service DigitalNetwork)

10JPEG Chuẩn nén ảnh của ủy ban

JPEG quốc tế (JointPhotographic Experts Group)

11 JPEG2000 Chuẩn nén ảnh JPEG2000

12LOSSLESS Kỹ thuật nén ảnh không

tổn hao (không mất dữliệu)

13 LOSSY Kỹ thuật nén ảnh có tổnhao (có mất dữ liệu)

14 MB Đa khối (Macroblock)

15MBAFF Mã hóa khung mành thích

nghi (Macroblock-AdaptiveFrame-Field coding)

16 MC Bù chuyển động (MotionCompensation)

17 ME Ước lượng chuyểnđộng(Motion Estimate)

18 MMS Dịch vụ tin nhắn đaphương tiện (Multimedia

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 105

Page 106: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Messaging Services)19 MSE Sai số bình phương trung

bình (Mean Square Error)

20MPEG Nhóm chuyên gia nén ảnh

động (Moving Pictures ExpertsGroup)

21 NAL Lớp trừu tượng mạng(Network Abstraction Layer)

22 NNS Tìm ở khối gần nhất(Nearest Neighbors Search)

23 PCM Điều xung mã (Pulse CodeModulation)

24 PF25 MF Hệ số nhân(Multipy Factor)

26PSNR Tỷ số tín hiệu đỉnh trên

nhiễu (Peak Signal to NoiseRatio)

27QCIF Định dạng hình ảnh có

kích thước 176 x 144(Quarter Common IntermediateFormat)

28 QP Thông số lượng tử(Quantization Parameter)

29 RBSP (Raw Byte Sequence Payload)

30RGB Ba màu cơ bản màu

đỏ/Xanh/Lam(Red/Green/Blue)

31 RLC Mã hoá dọc chiều dài(Run Length Coding)

32RSVP Giao thức dành riêng tài

nguyên mạng (ResourceReservation Protocol)

33RTP Giao thức truyền tải

thời gian thực (Real TimeTransport Protocol)

34 SDTV Truyền hình tiêu chuẩn

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 106

Page 107: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

( Standard Televison)

35SMIL Ngôn ngữ tích hợp

Multimedia đồng bộ(Synchronized MultimediaIntegration Language)

36SRC Điều khiển tốc độ bit

biến đổi được ( ScalableRate Control)

37 TSS Thuật toán tìm ba bước(Three-Step search)

38 UMTS (Universal MobileTelecommications System)

39 VCL Lớp mã hóa Video (VideoCoding Layer)

40 VLC Mã có chiều dài thay đổi(Variable Length Code)

41 VO Đối tượng Video (VideoObject)

42 VOP Đối tượng mặt phẳngVideo (Video Object Plane)

43YCbCr Độ chói, màu lam, màu đỏ

(Luminance, Blue chrominance,Red chrominance)

44ISO Tổ chức quốc tế về tiêu

chuẩn chất lượng(International Organization forStandardization)

45IEC Ủy ban kỹ thuật điện

quốc tế (InternationalElectro-technical Commission)

46 JTC1 Ủy ban kỹ thuật 1 (JointTechnical Committee 1)

47 SC29 Ủy ban phụ 29 (Sub-committee 29)

48 WG11 Nhóm làm việc 11( WorkGroup 11)

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 107

Page 108: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

PHỤ LỤCCode lập trình mô phỏng bằng Matlab

HEVC vs H.264/AVCfunction main()

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 108

Page 109: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

clear all; clc; fprintf('\nLUAN VAN TOT NGHIEP\n')fprintf('\nNGHIEN CUU HOAT DONG VA UNG DUNG CUA CHUAN H.265\n')fprintf('\nGVHD : TS. NGO VU DUC\n')fprintf('\nHVTH : TRAN QUANG CHIEN\n')fprintf('\nMSSV : CB120613\n')chonf = input('\nNHAP SO LUONG FRAMES SE MA HOA = ');chonq = input('\nNHAP GIA TRI BUOC LUONG TU TRONG KHOANG 0<=QP<52,QP= ');nq = chonq;nf = chonf; if (nq < 0 | nq > 51 | nf > 300) error('NHAP SAI GIA TRI LUONG TU HOAC SO FRAMES!!!!')endsave nq;fprintf('\nSE MA HOA %d FRAMES VOI BUOC LUONG TU QP=%d\n',nf,nq);mov = napmov(nf);tic; avc = mahoa(mov); fprintf('THOI GIAN MA HOA : %s\n',sec2timestr(toc));tic; mov2 = giaima(avc); fprintf('THOI GIAN GIAI MA : %s\n',sec2timestr(toc));save lastmov mov2 avc mov;

%%%% HAM MO FILE YUV ROI LUU THANH MATLAB MOVIE %%%%function movdata = napmov(nf) mov = yuv2mov('carphone.yuv',176,144,'420');%mov = yuv2mov('foreman.yuv',352,288,'420');save mov;load mov; if nf == 0 nf = length(mov);end% MOV(1) : MA TRAN CHOI, MOV (2), MOV(3) MA TRAN MAUmovdata = repmat(uint8(0),size(mov(1).cdata), nf);%tai tao laiMANG MOV RONGfor i = 1:nf % MA HOA TU FRAME 1 DEN FRAMETHU nf movdata(:,:,:,i) = mov(i).cdata;% LUU DU LIEU CUA CAC FRAME end%%%%%% HAM MA HOA FILE MATLAB MOVIE %%%%%%%function avc = mahoa(mov)

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 109

Page 110: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

fpat = 'IBBPBBPBBPBBPBBI'; % LOAI MAU FRAME (CHO TOAN BOMOVIE)k = 0; % FRAME DAU TIENpf = []; % MA TRAN MAU FRAME LA RONGprogressbar for i = 1:size(mov,4) % VONG LAP FRAME, TRA VE GIATRI COT % THU 4 TRONG MOV f = double(mov(:,:,:,i)); % BIEN DOI FRAME SANG GIA TRIDOUBLE f = rgb2yuv(f); k = k + 1; if k > length(fpat) k = 1; end ftype = fpat(k); % DAT TEN LOAI FRAME THU k [avc{i},pf] = mhframe(f,ftype,pf);% GOI HAM MA HOA CHO FRAMETHU i progressbar(i/(size(mov,4))) % HIEN THI % QUA TRINH MA HOA, end

%%%%% HAM MA HOA TUNG FRAME ANH %%%%%%function [avc,df] = mhframe(f,ftype,pf)[M,N,i] = size(f); % M = 176, N= 144,i = 3 TRONGfmbsize = [M, N] / 16; % PHAN CHIA THANH CACMACROBLOCKavc = struct('type',[],'mvx',[],'mvy',[],'scale',[],'coef',[]); avc(mbsize(1),mbsize(2)).type = [];pfy = pf(:,:,1);df = zeros(size(f));for m = 1:mbsize(1) % VONG LAP THEO CHIEU CAO for n = 1:mbsize(2) % VONG LAP THEO CHIEU RONG x = 16*(m-1)+1 : 16*(m-1)+16;% LAP TU 1-CAO y = 16*(n-1)+1 : 16*(n-1)+16;% LAP TU 1-RONG [avc(m,n),df(x,y,:)] =mhmblock(f(x,y,:),ftype,pf,pfy,x,y); end end

%%%%%%%%%% HAM MA HOA MAROBLOCK %%%%%%%%function [avc,dmb] = mhmblock(mb,ftype,pf,pfy,x,y)persistent q1 q2;if isempty(q1) %Neu mang q1 la rong. q1 = qintra;

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 110

Page 111: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

q2 = qinter;endload nq; %THONG SO BUOC LUONG TUscale = nq;avc.type = 'I'; % CAU TRUC AVCavc.mvx = 0;avc.mvy = 0;% TIM VECTOR CHUYEN DONG CHO ANH Pif ftype == 'P' avc.type = 'P'; [avc,emb] = getmotionvec(avc,mb,pf,pfy,x,y); mb = emb; % LAY PHAN SAI SO GIUA CAC FRAME P DEMA HOA q = q2; % NEU LA ANH P THI DU DOAN INTERelse q = q1; % NEU LA ANH Iend% TIM VECTOR CHUYEN DONG CHO ANH Bif ftype == 'B' avc.type = 'B'; [avc,emb] = getmotionvec(avc,mb,pf,pfy,x,y); mb = emb; % LAY PHAN SAI SO GIUA CAC FRAME B DEMHOA q = q2;else q = q1;end

% CHON KHOI VA TIEN HANH BIEN DOI DCT VA LUONG TUb = getblocks(mb);for i = 18:-1:1 avc.scale(i) = scale; % DAT VECTOR LUONG TU CHO KHOI i coef = dct2(b(:,:,i)); % BIEN DOI DCT HAI CHIEU CHO KHOITHU i avc.coef(:,:,i) = round( 8 * coef ./ (scale * q));end% CAU TRUC LAI KHOI DE THAM KHAOdmb = gmmblock(avc,pf,x,y);

%%%%% PHAN CHIA MACROBLOCK THANH 18 KHOI 4x4 %%%%%function b = getblocks(mb)b = zeros([4, 4, 18]); % TAO 18 MA TRAN 4x4 ZEROSb(:,:,1) = mb( 1:4, 1:4, 1);b(:,:,2) = mb( 1:4, 5:8, 1);b(:,:,3) = mb( 1:4, 9:12, 1);

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 111

Page 112: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

b(:,:,4) = mb( 1:4, 13:16, 1);b(:,:,5) = mb( 5:8, 1:4, 1);b(:,:,6) = mb( 5:8, 5:8, 1);b(:,:,7) = mb( 5:8, 9:12, 1);b(:,:,8) = mb( 5:8, 13:16, 1);b(:,:,9) = mb( 9:12, 1:4, 1);b(:,:,10) = mb( 9:12, 5:8, 1);b(:,:,11) = mb( 9:12, 9:12, 1);b(:,:,12) = mb( 9:12, 13:16, 1);b(:,:,13) = mb( 13:16, 1:4, 1);b(:,:,14) = mb( 13:16, 5:8, 1);b(:,:,15) = mb( 13:16, 9:12, 1);b(:,:,16) = mb( 13:16, 13:16, 1);% HAI KHOI CHROM (GIA TRI TRUNG BINH CUA 4 KHOI BEN CANH)b(:,:,17) = 0.25 * ( mb(1:4:15,1:4:15, 2) + mb(1:4:15,2:4:16,2) ... + mb(2:4:16,1:4:15, 2) + mb(2:4:16,2:4:16, 2));b(:,:,18) = 0.25 * ( mb(1:4:15,1:4:15, 3) + mb(1:4:15,2:4:16,3) ... + mb(2:4:16,1:4:15, 3) + mb(2:4:16,2:4:16,3) );

%%%% HAM TINH TOAN VECTOR CHUYEN DONG %%%%%%%function [avc,emb] = getmotionvec(avc,mb,pf,pfy,x,y)mby = mb(:,:,1); % CHI TIM TRONG THANH PHAN Y[M,N] = size(pfy);% TIM KIEU MOI KHIA CANH% maxstep = 10; % Largest allowable motion vector in x and y% mvxv = -maxstep:maxstep;% mvyv = -maxstep:maxstep;% minsad = inf;% for i = 1:length(mvxv)% tx = x + mvxv(i);% if (tx(1) < 1) | (M < tx(end))% continue% end% for j = 1:length(mvyv)% ty = y + mvyv(j);% if (ty(1) < 1) | (N < ty(end))% continue% end% sad = sum(sum(abs(mby-pfy(tx,ty))));% if sad < minsad% minsad = sad;% mvx = mvxv(i);

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 112

Page 113: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

% mvy = mvyv(j);% end% end% end

% TIM KIEU Logarithmicstep = 8; % KICH THUOC BUOC TIM KIEM Initialstep size for logarithmic searchdx = [0 1 1 0 -1 -1 -1 0 1]; % VECTOR CHI HUONG TIM KIEMdy = [0 0 1 1 1 0 -1 -1 -1]; % [origin, right, right-up, up,left-up, % left, left-down, down, right-down]mvx = 0;mvy = 0;while step >= 1 minsad = inf; for i = 1:length(dx) tx = x + mvx + dx(i)*step; if (tx(1) < 1) | (M < tx(end)) % NEU GIA TRI tx(1) <1 HOAC continue % M < GIA TRI tx CUOI CUNG end ty = y + mvy + dy(i)*step; if (ty(1) < 1) | (N < ty(end)) continue end sad = sum(sum(abs(mby-pfy(tx,ty)))); if sad < minsad ii = i minsad = sad; end end mvx = mvx + dx(ii)*step; mvy = mvy + dy(ii)*step; step = step / 2;endavc.mvx = mvx; % LUU VECTOR CHUYEN DONGavc.mvy = mvy;emb = mb - pf(x+mvx,y+mvy,:); % MACROBLOCK SAI SO

%%%%%%%%%%%%%%%%%% HAM GIAI MA %%%%%%%%%%%%%%%%%%%%function mov = giaima(avc)movsize = size(avc{1});mov = repmat(uint8(0),[16*movsize(1:2), 3, length(avc)]);pf = [];

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 113

Page 114: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

for i = 1:length(avc) % GIAI MA TOAN BO KHOI TRONG AVC f = gmframe(avc{i},pf); % GIAI MA FRAME pf = f; % LUU FRAME TRUOC DO f = yuv2rgb(f); % BIEN DOI FRAME SANG RGB f = min( max(f,0), 255); % GIOI HAN MOVIE TRONG KHOANG 8BITS mov(:,:,:,i) = uint8(f); % LUU FRAME progressbar(i/(length(avc)));end %%%%%%%%%%% HAM GIAI MA FRAME %%%%%%%%%%%%%function fr = gmframe(avc,pf)mbsize = size(avc); % KICH THUOC MB CHINH LA KICHTHUOC FILEM = 16 * mbsize(1);N = 16 * mbsize(2);fr = zeros(M,N,3);for m = 1:mbsize(1) % LAP TOAN BO MB for n = 1:mbsize(2) x = 16*(m-1)+1 : 16*(m-1)+16;% TAO LAI FRAME y = 16*(n-1)+1 : 16*(n-1)+16; fr(x,y,:) = gmmblock(avc(m,n),pf,x,y);% GOI HAM GIAI MA MBCHO KHOI end % macroblock loopend %mse = floor((mov(i).cdata)-(avc(i).cdata));%psnr = 10*log10(255^2/mse);%save psnr;%%%%%%%%%%%% HAM DAT KHOI %%%%%%%%%%%%%%%function mb = putblocks(b)mb = zeros([16, 16, 3]);mb( 1:4, 1:4, 1) = b(:,:,1);mb( 1:4, 5:8, 1) = b(:,:,2);mb( 1:4, 9:12, 1) = b(:,:,3);mb( 1:4, 13:16,1) = b(:,:,4);mb( 5:8, 1:4, 1) = b(:,:,5);mb( 5:8, 5:8, 1) = b(:,:,6);mb( 5:8, 9:12, 1) = b(:,:,7);mb( 5:8, 13:16, 1) = b(:,:,8);mb( 9:12, 1:4, 1) = b(:,:,9);mb( 9:12, 5:8, 1) = b(:,:,10);mb( 9:12, 9:12, 1) = b(:,:,11);mb( 9:12, 13:16, 1) = b(:,:,12);mb( 13:16, 1:4, 1) = b(:,:,13);mb( 13:16, 5:8, 1) = b(:,:,14);mb( 13:16, 9:12, 1) = b(:,:,15);

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 114

Page 115: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

mb( 13:16, 13:16, 1) = b(:,:,16);z = [1 1 1 1; 1 1 1 1; 1 1 1 1; 1 1 1 1 ]; % HAI KHOI MAUCHROMAmb(:,:,2) = kron(b(:,:,17),z);mb(:,:,3) = kron(b(:,:,18),z);

%%%%%%%%%%%%%%%%%%%%% HAM GIAI MA MB %%%%%%%%%%%%%%%%function mb = gmmblock(avc,pf,x,y)persistent q1 q2if isempty(q1) % MA TRAN HE SO LUONG TU q1 = qintra; q2 = qinter;endmb = zeros(16,16,3);% DU DOAN VOI VECTOR CHUYEN DONG CUA ANH Pif avc.type == 'P' mb = pf(x+avc.mvx,y+avc.mvy,:); q = q2;else q = q1;end% DU DOAN VOI VECTOR CHUYEN DONG CUA ANH Bif avc.type == 'B' mb = pf(x+avc.mvx,y+avc.mvy,:); q = q2;else q = q1;end% GIAI MA KHOIfor i = 18:-1:1 coef = avc.coef(:,:,i) .* (avc.scale(i) * q) / 8; % GIAI LUONGTU b(:,:,i) = idct2(coef); % BIEN DOI DCT NGUOC CHO HE SO MAHOAend% CAU TRUC Bmb = mb + putblocks(b);

%%%%%%%%% HAM BIEN DOI TU RGB SANG YUV %%%%%%%%%%%function yuv = rgb2yuv(rgb) % BIEN DOI TRUOC KHI MA HOAm = [ 0.299 0.587 0.144; %Y = 0.299R + 0.587R + 0.144B -0.168736 -0.331264 0.5; % MA TRAN BIEN DOI 0.5 -0.418688 -0.081312];% LAY DU LIEU MOVIE

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 115

Page 116: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

[nr,nc,c] = size(rgb);rgb = reshape(rgb,nr*nc,3); % TAI TAO CHO MA TRAN NHAN% MA HOA MAU BIEN DOIyuv = m * rgb';yuv = yuv + repmat([0; 0.5; 0.5],1,nr*nc);yuv = reshape(yuv',nr,nc,3); % TAI TAO LAI ANH GOC

%%%%%%%%%%%%%%% HAM BIEN DOI TU YUV SANG RGB %%%%%%%%%%function rgb = yuv2rgb(yuv) % BIEN DOI SAU KHI GIAI MAm = [ 0.299 0.587 0.144; -0.168736 -0.331264 0.5; 0.5 -0.418688 -0.081312];m = m^-1; % LAY NGHICH DAO MA TRAN m[nr,nc,c] = size(yuv); % LAY DU LIEU MOVIEyuv = reshape(yuv,nr*nc,3); % TAI TAO LAI CHO MA TRAN YUV rgb = yuv - repmat([0, 0.5, 0.5],nr*nc,1);% MA HOA BIEN DOI MAUrgb = m * rgb'; % rgb' hoan vi cua rgbrgb = reshape(rgb',nr,nc,3); % TAI TAO LAI ANH GOC

%%%%%%%%%%%% BANG LUONG TU CHO ANH INTER 4x4 P VA B %%%%%function q = qinterq = [17,17,16,16; 17,16,15,15; 16,15,15,15; 16,15,15,15];%%%%%%%%%%% BANG LUONG TU CHO ANH INTRA 4x4 %%%%%%%function q = qintraq = [ 9,13,18,21; 13,18,21,24; 18,21,24,27; 21,24,27,30];

Hàm plotvector.m

function plotvectorload lastmov;[M,N] = size(avc{1}); for f = 1:length(avc) if avc{f}(1,1).type == 'I'% neu la anh I thi bo qua continue end for i = 1:M for j = 1:N mvx(i,j) = avc{f}(i,j).mvy; mvy(i,j) = avc{f}(i,j).mvx;

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 116

Page 117: Luận văn TN

LUẬN VĂN TỐT NGHIỆP THẠC SĨ

end end figure quiver(flipud(mvx),flipud(mvy)) set(gca,'XLim',[-1, N+2],'YLim',[-1, M+2])% CAI DAT TOA DO CUAHINH title(sprintf('Vector chuyen dong cho anh thu %i',f))end

Hàm playmov.m

function playmov(n)load lastmovfor i = 1:size(mov,4) m(i).cdata = uint8([mov(:,:,:,i) mov2(:,:,:,i)]);% mov anhgoc, mov2 anh giai nen m(i).colormap = [];endfigure('Position',[30,100,750,400,]);axs=axes('Position',[0.05 0.15 0.8 0.55]);xlabel( 'Anh GOC------------------------------------------------------>>>>>>Anh NEN');movie(m,n,5); % Play mang m n lan, nhung lan sau play voi toc do5fps

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265 Trang 117