DECODE LÀ GÌ

  -  

Chắc rằng toàn bộ phần đa người phần đa biết về vấn đề đó tại một cường độ nào kia, mà lại không hiểu biết sao các kiến thức này lại bị thiếu tính trong số cuộc bàn cãi về vnạp năng lượng phiên bản, đề nghị đầu tiên hãy nhắc lại một chút: Máy tính cần thiết nào lưu trữ được “chữ”, “số”, “ảnh”, tốt bất cứ sản phẩm công nghệ gì không giống. Thđọng duy nhất nhưng nó có thể lưu lại được với làm việc thuộc đó là bit. Một bit chỉ hoàn toàn có thể tất cả 2 giá chỉ trị: gồm hoặc ko, đúng hoặc không đúng, 1 hoặc 0, bạn thích Call theo cách làm sao cũng được. Vì máy vi tính hoạt động bằng điện, một bit thực chất có thể được biểu thị bởi năng lượng điện áp, xung hiện tại hoặc tinh thần điện của mạch flip-flop. Đối với bé người, bit thường xuyên được biểu lộ bằng 1 và 0 nên hãy coi đó là quy ước nhìn trong suốt bài viết này.

Bạn đang xem: Decode là gì

Đang xem: Decode là gì

Để dùng bit để diễn tả đến bất kể trang bị gì, chúng ta đề nghị các phép tắc. Chúng ta rất cần phải biến hóa một chuỗi những bit thành đồ vật nào đấy như chữ, số cùng hình họa bằng phương pháp áp dụng một encoding scheme (lược vật mã hóa), hoặc Hotline tắt là encoding. Như cố gắng này:

01100010 01101001 01110100 01110011b i t sTrong encoding này, 01100010 đại diện đến chữ “b”, 01101001 cho chữ “i”, 01110100 mang lại chữ “t” và 01110011 cho chữ “s”. Một chuỗi các bit nhất quyết sẽ thay mặt đại diện cho một chữ cùng một chữ vẫn thay mặt đại diện cho 1 chuỗi những bit nhất thiết. Nếu chúng ta gồm đầu óc xuất sắc nhằm lưu giữ được chuỗi bit mang đến 26 chữ thì bạn cũng có thể đọc bit nhỏng đọc sách vậy.

Encoding scheme trên được Hotline là ASCII. Một chuỗi những hàng đầu với 0 được chia ra thành đa phần, từng phần 8 bit (hoặc 1 byte). ASCII luật pháp một bảng để dịch tự byte quý phái vần âm nhưng mà nhỏ bạn hoàn toàn có thể hiểu được. Dưới đấy là 1 phần bé dại của bảng đó:

bitscharacter
01000001A
01000010B
01000011C
01000100D
01000101E
01000110F

Có tổng cộng 95 ký trường đoản cú có thể gọi được chính sách trong bảng ASCII, bao gồm chữ trường đoản cú A mang đến Z ngơi nghỉ trạng thái thường và in hoa, số tự 0 mang lại 9, một số trong những vệt chnóng câu với các ký từ bỏ nhỏng đồng đô la, vệt chnóng than và một vài lắp thêm khác. Nó cũng bao hàm 33 quý giá đến một số trong những lắp thêm như lốt biện pháp, lốt xuống dòng, tab, backspace,… Những thứ này tất nhiên không thể in ra được, tuy thế cũng vẫn hữu hình nghỉ ngơi một vài dạng cùng hữu dụng thẳng với nhỏ bạn. Một vài ba giá trị thì chỉ có lợi với máy tính xách tay, nhỏng mã để lưu lại bắt đầu cùng xong xuôi của văn bản. Tộng cùng tất cả 128 ký trường đoản cú được tư tưởng vào encoding ASCII, đó là 1 con số rất đẹp (với những người dân không còn xa lạ với đồ vật tính), cũng chính vì nó thực hiện hết tất cả các phối kết hợp có thể của 7 bit (0000000 cho tới 1111111).

Và tiếng thì họ đã tất cả cách để thể hiện vnạp năng lượng bạn dạng chỉ bằng việc áp dụng 1 với 0:

01001000 01100101 01101100 01101100 01101111 00100000 01010111 01101111 01110010 01101100 01100100 “Hello World”Thuật ngữ quan liêu trọngĐể encode một sản phẩm nào đấy bởi ASCII, tuân theo bảng từ bỏ phải qua trái, sửa chữa thay thế những chữ bằng những bit. Để decode một chuỗi những bit thành các ký từ hoàn toàn có thể đọc được, tuân theo bảng từ trái qua đề nghị, thay thế các bit bằng chữ.

Encode tức là áp dụng một vật dụng gì đó để trình bày cho 1 sản phẩm công nghệ không giống. encoding là một trong tập hợp những luật lệ nhằm tiến hành Việc đổi khác kia.

Một số thuật ngữ khác buộc phải được gia công rõ vào ngữ chình họa này:

character phối, charset

Tập đúng theo những cam kết từ bỏ rất có thể được encode. “Mã hóa ASCII bao gồm 1 bộ ký từ bỏ bao gồm 128 ký kết từ.” Về cơ phiên bản thì đồng nghĩa với “encoding”.

code page

Một “trang” các mã để liên kết các cam kết trường đoản cú với cùng 1 chuỗi những bit khớp ứng. Cũng rất có thể hiểu là 1 trong “bảng”. Về cơ phiên bản thì đồng nghĩa tương quan cùng với “encoding”.

Xem thêm: Cách Tải Và Cài The Monkey Eyes, Game Rèn Luyện Khả Năng Quan Sát (2021) ✔️ Cẩm Nang Tiếng Anh ✔️

string

Một string là một số những yếu tắc được xâu lại với nhau. Một chuỗi bit là 1 trong những loạt các bit, nhỏng 01010011. Một chuỗi cam kết tự là 1 trong những loạt các ký từ bỏ, như vậy này. Đồng nghĩa với “sequence”.

Binary, Octal, Decimal, Hex

Có không ít phương pháp để viết một số trong những. 10011111 trong những hệ nhị phân là 237 vào hệ chén bát phân, 159 trong hệ thập phân với 9F vào hệ thập lục phân. Chúng đều trình bày một quý giá, mà lại số thập lục phân lại ngắn gọn gàng rộng cùng đọc dễ dàng hơn so với số nhị phân. Tuy thế tôi sẽ dùng nhị phân nhìn trong suốt nội dung bài viết này để gia công sự việc trnghỉ ngơi đề nghị dễ hiểu hơn tương tự như vứt bỏ giảm được một tờ trừu tượng. Đừng lo nếu bạn thấy chỗ nào kia những mã ký trường đoản cú lại được viết ngơi nghỉ hệ khác nhé, bọn chúng đồng nhất cả thôi.

Excusez-Moi?

Sau khi đang nắm rõ gần như ý bên trên rồi thì thuộc thụ thiệt với nhau nào: 95 ký tự là thừa hiếm khi chúng ta nói tới những ngôn ngữ. Nó rất có thể vận dụng mang đến tiếng Anh cơ phiên bản, nhưng vẫn núm làm sao trường hợp chúng ta mong viết một risqué letter (thỏng báo không may ro) bằng tiếng Pháp? Straßen­übergangs­änderungs­gesetz (cách thức mặt đường bộ) trong tiếng Đức? Một lời mời mang đến tiệc smörgåsbord (tiệc đứng) bằng giờ Thụy Điển? Ờm, chúng ta cần thiết. Không thể bởi ASCII. Không có một chỉ dẫn nào cho vấn đề mô tả những chữ nhỏng é, ß, ü, ä, ö or å vào ASCII, phải họ cần yếu cần sử dụng nó được.

“Nhưng quan sát coi,” dân châu Âu nói, “trong một chiếc laptop phổ cập với 1 byte bằng 8 bit, mã hóa ASCII đã có tác dụng giá thành phạm hẳn 1 bit Lúc luôn luôn phối giá trị của chính nó là 0! Chúng ta hoàn toàn có thể cần sử dụng bit này để nhét thêm tận 128 giá trị vào cái biển đó!” Và chúng ta đang có tác dụng những điều đó. Nhưng bao gồm cả nuốm, có không ít hơn 128 cách để đặt vết cho một nguyên âm. Chúng ta quan trọng làm sao đưa hết toàn bộ những trở nên thể của chữ cái được dùng trong các ngữ điệu của toàn Châu Âu vào trong cùng một bảng với tối nhiều 256 quý giá được. Và tiếp đến trái đất chìm ngập trong một hải dương các encoding, những tiêu chuẩn, những tiêu chuẩn chỉnh thực tiễn với thậm chí là là… nửa tiêu chuẩn chỉnh nhằm sử dụng cho những cỗ ký tự khác biệt. Một bạn làm sao kia cần phải viết một văn uống bạn dạng về giờ đồng hồ Thụy Điển bằng giờ đồng hồ Séc, tìm không ra encoding như thế nào vận dụng cho tất cả 2 ngữ điệu này đề nghị đành từ chế ra một chiếc. Và cthị trấn đó ra mắt hàng ngàn lần.

Và cũng nhớ rằng giờ đồng hồ Nga, giờ đồng hồ Ấn Độ, giờ Ả Rập, giờ đồng hồ Do Thái, tiếng Hàn và hàng ngàn ngôn từ không giống đang rất được cần sử dụng bên trên trái khu đất. Chưa kể những ngữ điệu đã không còn được dùng nữa. Một khi bạn vẫn giải được bài xích toán làm nắm nào để viết những ngữ điệu vào và một vnạp năng lượng phiên bản cùng với các thiết bị giờ trên, hãy thách thức phiên bản thân bởi tiếng Trung. Hoặc tiếng Nhật. Cả 2 ngữ điệu này chứa cả chục ngàn cam kết trường đoản cú. Quý khách hàng bao gồm về tối đa 256 cực hiếm trong một byte chứa 8 bit. Triển!

Mã hóa đa byte (Multi-Byte Encodings)

Để tạo thành một bảng liên kết những ký kết tự với chữ cái cho một ngôn từ có tương đối nhiều hơn 256 ký kết tự, một byte đơn giản và dễ dàng là cảm thấy không được. Với 2 byte (16 bit), bạn có thể mã hóa cho tới 65,536 ký kết từ bỏ khác nhau. BIG-5 là một encoding áp dụng từ thời điểm cách đây. Ttuyệt vì bóc tách một chuỗi những bit thành blochồng 8, nó bóc tách thành blochồng 16 với có một cái bảng lớn tưởng (ý tôi là, KHỔNG LỒ) dụng cụ việc ký từ bỏ làm sao thì link cùng chuỗi bit nào. BIG-5 ở thể dễ dàng độc nhất vô nhị sẽ cách xử trí phần đông các ký kết tự của tiếng Trung phồn thể. GB18030 là một encoding khác cũng có thể có biện pháp tiếp cận tương tự, tuy vậy nó bao hàm cả giờ Trung giản thể và phồn thể luôn luôn. Và trước khi chúng ta hỏi, thì đúng vậy, tất cả cả những encoding khác chỉ dành cho giờ Trung giản thể thôi. Tôi chỉ ao ước cần sử dụng 1 encoding thôi nhưng cũng trở ngại chũm sao?

Dưới đó là một trong những phần nhỏ của bảng mã hóa GB18030:

bitscharacter
10000001 01000000
10000001 01000001
10000001 01000010
10000001 01000011
10000001 01000100

GB18030 cách xử lý một lượng phệ những ký tự (bao gồm cả đa phần các ký từ La tinh), tuy nhiên sau cuối thì nó cũng chỉ là một trong những format mã hóa siêng biệt trong sản phẩm hà sa số những dòng không giống thôi.

Sự hồi hộp sở hữu thương hiệu Unicode

Cuối cùng thì cũng có fan chịu đựng hết nổi và sẽ vực lên tạo ra một chuẩn chỉnh mã hóa nhằm đúng theo nhất tất cả các chuẩn chỉnh khác. Chuẩn này được điện thoại tư vấn là Unicode. Về cơ bạn dạng nó có mang một bảng Khủng cực lớn với cùng một,114,112 những code point hoàn toàn có thể được sử dụng đến mọi các loại chữ cái và biểu tượng. Nó thừa đầy đủ nhằm mã hóa toàn thể giờ đồng hồ châu Âu, Trung Đông, Viễn Đông, miền Nam, miền Bắc, miền Tây, tiền sử cùng cả những ngôn ngữ sau này mà lại bé fan không suy nghĩ ra. Sử dụng Unicode, bạn có thể soạn vnạp năng lượng bạn dạng đựng gần như là số đông ngôn từ bằng rất nhiều cam kết trường đoản cú nhưng bạn cũng có thể gõ ra. Vấn đề này hoặc là bất khả thi hoặc siêu rất cạnh tranh để tiến hành trước lúc Unicode Thành lập. Thậm chí còn tồn tại một mục không đồng ý giành cho giờ Klingon (Star Trek) trong Unicode. Bạn thấy kia, Unicode Khủng mang lại nỗi nó cũng được cho phép sử dụng vào mục tiêu cá thể luôn luôn.

Xem thêm: Top 10 Tựa Game Đua Xe Offline Pc Hay Nhất, Top 10 Tựa Game Đua Xe Offline Trên Pc Hay Nhất

*
*
*
Nghĩa Của Từ Decode Là Gì - Nghĩa Của Từ Decode Trong Tiếng Việt 8

(Hết phần 1)

Bài viết được dịch từ What Every Programmer Absolutely, Positively Needs To Know About Encodings And Character Sets To Work With Text.