Prosessen med konvertering av data fra en form til en annen form er kjent som koding. Den brukes til å transformere dataene slik at data kan støttes og brukes av forskjellige systemer. Koding fungerer på samme måte som å konvertere temperatur fra Celsius til Fahrenheit, ettersom den bare blir konvertert i en annen form, men den opprinnelige verdien forblir alltid den samme. Koding brukes hovedsakelig i to felt:
Merk: Koding er forskjellig fra kryptering ettersom hovedformålet ikke er å skjule dataene, men å konvertere dem til et format slik at de kan konsumeres riktig.
I dette emnet skal vi diskutere de forskjellige typene kodingsteknikker som brukes i databehandling.
Type kodingsteknikk
Tegnkoding
Tegnkoding koder tegn til byte . Den informerer datamaskinene om hvordan de skal tolke null og enere til ekte tegn, tall og symboler. Datamaskinen forstår bare binære data; derfor er det nødvendig å konvertere disse tegnene til numeriske koder. For å oppnå dette konverteres hvert tegn til binær kode, og for dette lagres tekstdokumenter med kodingstyper. Det kan gjøres ved å pare tall med tegn. Hvis vi ikke bruker tegnkoding, vil ikke nettstedet vårt vise tegnene og teksten i riktig format. Derfor vil det redusere lesbarheten, og maskinen vil ikke være i stand til å behandle data riktig. Videre sørger tegnkoding for at hvert tegn har en riktig representasjon i datamaskin- eller binærformat.
Det finnes forskjellige typer tegnkodingsteknikker, som er gitt nedenfor:
HTML-koding
HTML-koding brukes til å vise en HTML-side i riktig format. Med koding får en nettleser vite hvilket tegnsett som skal brukes.
I HTML er det forskjellige tegn som brukes i HTML Markup som . For å kode disse tegnene som innhold, må vi bruke en koding.
URL-koding
URL (Uniform Resource Locator) Koding brukes til konvertere tegn i et slikt format at de kan overføres over internett . Det er også kjent som prosentkoding. URL-kodingen utføres for å sende URL-en til internett ved hjelp av ASCII-tegnsettet. Ikke-ASCII-tegn erstattes med en %, etterfulgt av heksadesimale sifre.
UNICODE-koding
Unicode er en kodingsstandard for et universelt tegnsett. Den tillater koding, representasjon og håndtering av teksten representert på de fleste språk eller skriftsystemer som er tilgjengelig over hele verden. Den gir et kodepunkt eller nummer for hvert tegn på alle støttede språk. Den kan representere omtrent alle mulige tegn på alle språkene. En bestemt sekvens av biter er kjent som en kodeenhet.
En UNICODE-standard kan bruke 8, 16 eller 32 biter for å representere tegnene.
Unicode-standarden definerer Unicode Transformation Format (UTF) for å kode kodepunktene.
UNICODE-kodingsstandarden har følgende UTF-skjemaer:
UTF8 er definert av UNICODE-standarden, som er tegnkoding med variabel bredde som brukes i elektronisk kommunikasjon. UTF-8 er i stand til å kode alle 1 112 064 gyldige tegnkodepunkter i Unicode ved å bruke én til fire én-byte (8-biters) kodeenheter.
UTF16-koding representerer et tegns kodepunkter ved å bruke ett av to 16-bits heltall.
UTF32-koding representerer hvert kodepunkt som 32-biters heltall.
Base64-koding
Base64-koding brukes til å kode binære data til tilsvarende ASCII-tegn. Base64-kodingen brukes i Mail-systemet da postsystemer som SMTP ikke kan fungere med binære data fordi de kun aksepterer ASCII-tekstdata. Den brukes også i enkel HTTP-autentisering for å kode legitimasjonen. Dessuten brukes den også til å overføre binære data til informasjonskapsler og andre parametere for å gjøre data uleselige for å forhindre tukling. Hvis et bilde eller en annen fil overføres uten Base64-koding, vil den bli ødelagt da postsystemet ikke er i stand til å håndtere binære data.
Base64 representerer dataene i blokker på 3 byte, der hver byte inneholder 8 biter; derfor representerer den 24 biter. Disse 24 bitene er delt inn i fire grupper på 6 bits. Hver av disse gruppene eller delene konverteres til tilsvarende Base64-verdi.
ASCII-koding
American Standard Code for Information Interchange (ASCII) er en type tegnkoding. Det var den første tegnkodingsstandarden som ble utgitt i 1963.
ASCII-koden brukes til å representere engelske tegn som tall, hvor hver bokstav er tilordnet et tall fra 0 til 127. De fleste moderne tegnkodingsskjemaer er basert på ASCII, selv om de støtter mange tilleggstegn. Det er en enkeltbyte-koding som bare bruker de nederste 7 bitene. I en ASCII-fil er hvert alfabetisk, numerisk eller spesialtegn representert med et 7-bits binært tall. Hvert tegn på tastaturet har en tilsvarende ASCII-verdi.
Bilde- og lyd- og videokoding
Bilde- og lyd- og videokoding utføres for å spare lagringsplass. En mediefil som bilde, lyd og video er kodet for å lagre dem i et mer effektivt og komprimert format.
Disse kodede filene inneholder det samme innholdet med vanligvis lignende kvalitet, men i komprimert størrelse, slik at de kan lagres på mindre plass, enkelt kan overføres via post eller lastes ned på systemet.
Vi kan forstå det som en . WAV-lydfilen konverteres til .MP3-fil for å redusere størrelsen med 1/10thtil sin opprinnelige størrelse.