Preparació de la PS

Per preparar la PS de l’assignatura “Tractament i publicació de vídeo” vaig preparar els següents apunts, basats en les preguntes que havien sortit en anys anteriors:

 

 

 

 

 

Histogrames. Imatge fosca/clara? Dibuixar l’histograma original, histograma després d’aplicar l’enfosquiment i la corba per enfosquir la imatge.

Representació gràfica de la distribució dels valors dels píxels que ens indica el nombre de píxels a cada nivell d’intensitat de color.

Informació qualitativa (sobre la imatge)

Informació quantitativa (de tipus estadístic)

Ens mostra el nivell de detall en les zones de ombres, tons mitjos i llums

Molt detall a les tres zones

Més detall als tons clars

Imatge sobre-exposada

Probable pèrdua de detall en els tons clars

Imatge infra-exposada

Probable pèrdua de detall en els tons foscs

El programa Photoshop ens mostra també mesures estadístiques: mitjana(valor d’intensitat mitjà), mediana (nivell central de la distribució)

  1. TRANSFORMACIONS PUNTUALS (PANBEL)

Cada píxel nou s’obté a partir d’un únic píxel

  • Negatiu
  • Binarització
  • Aclariment
  • Enfosquiment
  • Lineals per parts

 

Funcions que podem representar gràficament sobre els eixos “x” (entrada) i “y” (sortida)
Transformació negatiu (inversa)

  • Inversió dels valors de gris de la imatge d’entrada de manera que el blanc passa a ser negre i el negre blanc
  • T(I) 255 – l T(50) = 255 – 50 = 205
  • Fer el negatiu d’una imatge i realçar els detalls clars en una imatge fosca

 

Binarització

  • Tots els nivells de gris es veuen reduïts a dos
  • Llindar (threshold)

Aclariment

  • Permet veure amb detall zones fosques
  • Augmenta el rang dels valors foscos i disminueix el rang dels valors clars

 

 

 

 

Enfosquiment

  • Permet veure amb detall zones clares
  • Augmenta el rang dels valors clars i disminueix el rang dels valors foscos

 

Lineals per parts

  • La corba de transformació està formada per trams
  • El rang de grisos fins al punt x s’enfosqueix
  • El rang de grisos a partir del punt y s’aclareix
  • Usos: modificar el contrast d’una imatge

 

Pseudocolor. Definició i usos.

  • Transformació puntual (píxel a píxel).
  • Associació arbitrària entre nivells de grisos i determinats colors amb la finalitat d’aconseguir una visualització en color d’una imatge monocromàtica que destaqui millor alguns detalls.
  • Ocupa els mateixos bits que la representació monocromàtica.
  • Usos: visualitzacions mèdiques (ressonàncies magnètiques, etc…)

 

Fals color

  • Transformació puntual (píxel a píxel).
  • S’obté a partir d’imatges en color canviant el color del píxel per obtenir-ne un de nou
  • Es modifica cada una de les components (RGB) amb transformacions com aclariment, enfosquiment, etc…

 

Nombre de nivell de gris

  • 1 bit: blanc i negre
  • < 5 bits: falsos contorns
  • Profunditat més habitual per imatges monocromàtiques: 8 bits, 28 = 256 valors
  • 16 bits quan s’ha de fer servir processat molt extens

 

 

Color indexat. Uniforme i adaptatiu.

  • Paleta de només 256 colors
  • Cada píxel conté només el valor de l’índex dins la paleta (taula)

Mètodes per la tria de colors de la paleta:

  • Uniforme: divideix l’espai en regions iguals i tria el valor mitjà de cada regió
  • De Popularitat (adaptatiu): divideix l’espai en regions iguals però tria el valor més freqüent


  1. TRANSFORMACIONS ESPACIALS LINEALS

El valor de cada píxel processat depèn del píxel de la mateixa posició i dels seus veïns

Condició de linealitat: si apliquem la operació sobre dues imatges diferents i posteriorment les sumem, el resultat és el mateix que si les sumem primer i després apliquem l’operació.

Màscares de convolució

  • Matrius normalment quadrades
  • Coeficients: elements de la matriu
  • Finestra de treball: regió de la imatge que coincideix amb la màscara
  • Exemple i detall aplicació d’una màscara a una imatge.

 

Filtres suavitzadors

  • Les màscares de suavització tendeixen a difuminar la imatge          (esborrar els contorns més fins)
  • Es mitjana amb els píxels veïns
  • Els coeficients de la màscara sumen la unitat
  • Com més pes té el valor del píxel central, menys suavitzat
  • Usos: reducció de soroll, desenfocament

 

 

Filtres de realçament (derivadors)

– origen matemàtic: la derivada de funcions

  1. a) Màscares laplacianes (èmfasi general de contorns)

– Suma zero: detecta i realça exclusivament els contorns

– Suma unitat: realça els contorns sense perdre la informació sobre zones uniformes

 

  1. b) Màscares de gradients (èmfasi selectiu de contorns)
  • Màscara detectora de contorn
  • Es pot descompondre en dues màscares que localitzen els contorns horitzontals i verticals per separat
  • Tipus: Prewitt i Sobel
  • Menys sensibles al gra i contorns detectats menys fins
  • Usos: enfocament

 


 

  1. TRANSFORMACIONS ESPACIALS NO LINEALS (MEDOT)

No compleixen la condició de linealitat

  1. Filtre de mediana
  • Reduir renou impulsional
  • Elimina els valors extrems per sota i sobre de la mitjana

 

  1. Operacions Morfològiques
  • Element estructurant: matriu similar a la màscara en la que els coeficients poden tenir el valor 0 o 1 segons si queden o no afectats per l’operació o no
  • Construides a partir de dues operacions bàsiques: erosió i dilació

Erosió

  • Busca el valor mínim del nivell de gris en la finestra de treball i substitueix cada píxel de la imatge original per aquest valor mínim
  • Suprimeix els detalls més clars de la imatge i la enfosqueix globalment
  • Els quadradets petits (en relació a l’element estructurant) desapareixen
  • Separa objectes propers

 

Dilatació

  • Busca el valor màxim del nivell de gris en la finestra de treball i substitueix cada píxel de la imatge original per aquest valor màxim
  • Suprimeix els detalls més foscs de la imatge i la aclareix globalment
  • Uneix objectes propers

Obertura. Usos. (0ED)

  • Transformació espacial no lineal
  • Erosió à Dilatació amb mateix element estructurant
    • Erosió: esborra els petits detalls d’intensitat alta i enfosqueix la imatge
    • Dilació: aclareix la imatge sense recuperar els elements esborrats
  • Elimina els detalls clars d’una imatge (els elements més petits que l’element estructurant).
  • Usos: diferenciar estrelles d’una fotografia de renou de fons

 

 

Tancament. Usos. (TDE)

  • Transformació espacial no lineal
    • Dilatació à Erosió amb mateix element estructurant
    • Dilatació: elimina els petits detalls foscos alhora que aclareix la imatge
  • Erosió: enfosqueix l’imatge sense recuperar els detalls eliminats
  • Elimina els detalls foscos d’una imatge (els elements més petits que l’element estructurant).
  • Usos: eliminar cables d’electricitat.

 

Èmfasi de contorns mitjançant erosió

Els contorns d’una imatge es poden obtenir restant en una imatge la serva versió erosionada

  1. TRANSFORMACIONS GEOMÈTRIQUES (GIDRBP)

Modifiquen les relacions espacials entre els píxels sense modificar el nivell. La imatge processada conté els píxels de la original amb els mateix nivell de gris, però en posicions diferents.

  • Interpolació
  • Delmació
  • Rotació
  • Biaix
  • Perspectiva

Interpolació

  • Augmenta el nombre de píxels d’una imatge
  • Mantén la informació
  • Factor d’interpolació: relació entre nombre files/columnes abans i després
  • Aplicacions: zoom “digital”

Mètodes:

  • Del veí més proper
  • Bilineal: pren com referència els valors dels quatre veïns més propers
  • Fa servir veïnatges de 16 píxels amb més importància als 4 més propers

 

Delmació

  • Redueix el nombre de píxels d’una imatge.
  • No mantén la informació. Procés irrecuperable
  • Transformació geomètrica
  • Tipus: sense interpolar, amb interpolació bilineal, amb interpolació bicúbica.
  • Afecta sobre tot als contorns en les zones de més contrast

Rotació

Fixa un punt d’origen en torn al qual gira la imatge un determinat nombre de graus

 

 

 

 

Biaix

Rotació amb angles diferents a la dimensió vertical i horitzontal

 

 

 

 

 

Perspectiva

Deixa un costat de la imatge fix i fa el costat oposat més petit de manera que queda més allunyat i crea efecte de profunditat

 

 


  1. DISPOSITIUS DE VISUALITZACIÓ

 

Monitors CRT (Cathode Ray Tube)

  • Pràcticament desapareguts del mercat
  • Aprofita propietat materials fosforescents d’emetre llum quan s’exciten amb electrons
  • La cara interna de la pantalla està recoberta d’una malla de cèl·lules, cada cèl·lula RGB
  • El feix escombra la pantalla seqüencialment a la freqüència de refresc (>60 Hz)
  • Degut a la persistència veiem una sola imatge

 

Monitors TFT/LCD

  • Camps elèctrics modifiquen l’orientació de les molècules del cristall, permetent o no el pas del llum
  • El color s’obté mitjançant tres filtres (RGB)
  • Variants que milloren la qualitat: TFT. LED
  • Resolució fixa, habitualment format panoràmic

 

Monitors de Plasma

  • L’abaratiment de la tecnologia LED les ha fet pràcticament obsoletes.
  • Aprofita excitació materials fosforescent
  • Cada cel·la està formada per dos panells de cristall que contenen neó i xenó
  • En aplicar una tensió elèctrica els gasos es ionitzen (converteixen en plasma) i els electrons xoquen contra materials fosforescents que desprenen llum

 

Monitors OLED

  • Els elements emissors de llum són díodes
  • Problemes tecnològics: degradació ràpida del material orgànic i cost elevat
  • Avantatges: bona qualitat, negres profunds, baix consum, flexibles

 

 

  1. DISPOSITIUS D’IMPRESSIÓ

Ens permeten obtenir físicament la nostra imatge sobre paper, plàstic o tela

Color. Com es trasllada al suport físic.

  • Les imatges impreses no generen llum sinó que la reflecteixen
  • Els colors que hi veiem són els que la superfície d’impressió NO absorbeix. Per exemple, el cian absorbeix la llum vermella i reflecteix la verda i blava.
  • Sistema de generació subtractiu CYM o CYMK (afegeix un negre pur)

 

Resolució

  • Quantitat de punts de tinta per polzada (ppi o dpi) que és capaç d’imprimir una impressora
  • Valors actuals són fins 4800x1200ppp per inkjet i 1200×1200 per làser

 

Impressores de tecnologia làser

Basades en l’electrostàtica (atracció o repulsió de càrregues segons el seu signe)

  1. a) Ordre d’impressió carrega inicialment el tambor negativament
  2. b) El làser escombra marcant positivament els punts a imprimir
  3. c) El full de paper es carrega positivament, passa pel tambor i el tòner s’hi transfereix
  4. d) El calor fixa el pigment al paper

 

Impressores d’injecció de tinta

  • El capçal conté uns broquets molt fins que dipositen sobre el paper la tinta que surt dels injectors
  • La tinta és líquida i les gotes són de l’orde de picolitres
  • El capçal recorre el full imprimint-hi línia a línia (més lentament que en el làser)
  1. SUPORTS D’ENREGISTRAMENT

 

Suports magnètics

  • Camps magnètics: es poden representar mitjançant línies de camp que ens permeten definir força, direcció i sentit del camp en qualsevol punt de l’espai
  • Electromagnetisme: la variació d’un camp elèctric genera una variació d’un camp magnètic (i viceversa)
  • Dades digitals i analògiques
  • Enregistrament en cinta
  • Suport de polièster recobert amb una capa fina de partícules fèrriques amb la seva polaritat
  • Per enregistrar es passa la cinta sota la influència del camp magnètic que orienta les partícules
  • Per llegir la disposició de les partícules genera un camp magnètic variable que capta el capçal de lectura i el converteix en electricitat
  • Dues configuracions a) capçal fixe, es mou la cinta (cassete) b) el capçal gira dins un tambor per augmentar la velocitat relativa respecte de la cinta enfilada helicoïdalment.
  • Enregistrament en un disc dur
  • Sèrie de discos, amb una petita separació entre ells, recoberts per aliatge metàl·lic,units un eix central i aquest a un motor que gira entre 3600 – 10000 rpm
  • Sobre cada disc hi ha capçals suportats per un braç mecànic que es mouen transversalment sense arribar a tocar el disc
  • Les dades es distribueixen en
  1. a) pistes (cercles prims concèntrics)
  2. b) cilindres (conjunts de pistes dels diferents discos que són a la mateixa distància del centre
  3. c) sectors (agrupacions de bytes),
  4. d) clústers (conjunt contigu de sectors)

 

Suports òptics

  • dades digitals (però el làserDisc dels 70 era analògic, vídeo compost)
  • funcionament basat en la relació entre unes petites pertorbacions ubicades a la superfície del disc metàl·lic i com s’alteren les característiques del llum làser en impactar sobre aquestes pertorbacions
  • espiral seqüencial que comença a l’interior,
  • velocitat de gir variable per mantenir flux de dades constant controlada pel mateix flux de dades
  • tracking
  • autofocus

 

Suports magnetoòptics

  • les dades s’enregistren sobre un disc magnètic com en un disc dur
  • però només es pot gravar quan la temperatura és molt elevada

 

Sistemes d’emmagatzemament en estat sòlid

  • Solid State Drive (SSD)
  • Tecnologia basada en transistors integrats.
  • Tècniques SLC (single level cell) i MLC (mutiple level cell)
  • Poden emmagatzemar dades encara que no tinguin alimentació (no volàtils)
  • Relació preu/byte i mides màximes millorant
  • Més ràpida, silenciosa i resistent que els HDD. Menys consum.

 

 

 

  1. FORMATS DE VÍDEO DIGITALS

 

Codi de temps o timecode

  • Sistema de numeració que etiqueta i permet identificar tots els fotogrames gravats.
  • Senyal digital definit per la SMPTE/EBU
  • Numeració expressada en hores, minuts, segons i fotogrames
  • Tipus: LTC (gravat longitudinal com si fos una pista d’àudio)

Vertical interval timecode (gravada amb el senyal de vídeo en línies d’interval d’esborrament de pantalla)

 

Tècniques de compressió reversibles e irreversibles

Les imatges i els vídeos es poden comprimir acceptant alguna pèrdua de qualitat irrecuperable (lossy)

Reversibles (winzip, winrar) millors per documents o aplicacions (lossless) però presenten factors de compressió més reduïts.

 

Compressió espacial i temporal

  • Espacial: per imatges fixes (jpeg, gif, tga, png…), sistemes de compressió intra
  • Temporal: per vídeo, aprofita el nivell de redundància entre fotogrames consecutius, sistemes de compressió No es codifiquen les dades entre fotogrames consecutius que són iguals, tan sols un fotograma sencer i posteriorment les petites diferències.
    • Interframe: es comparen dades de fotogrames consecutius
    • Interfield: es comparen les dades de camps consecutius d’un vídeo d’escanejat entrellaçat

 

D1

Sony i BTS. Cinta ¾ de polzada. Gran ample de banda. Video per components

Betacam Digital

Sony. Finals 90 i principis 00’s més usat. Compatibilitat amb cintes Betacam analògiques.

Betacam SX

Sony. Cinta ½ polzada. Compressió elevada MPEG-2

Betacam IMX

Sony. Factor de comrpessió més reduït.

 

DV i Mini-DV

Consorci >60 empreses. Gravació domèstica.

Compressió intraquadre (DCT) + compressió temporal intracamp (segons el moviment)

DVCAM

Sony. Basat en el DVCAM (mateixa cinta).

També conmuta entre intraquadre i intracamp segons el contingut del programa

CLIPLINK per marcar seqüencies com vàlides o no vàlides

DVC PRO 25

Panasonic. Compatibilitat cap avall amb DVCAM i DV/MiniDV.

Norma de mostreig 4:1:1, imatges alta qualitat a 25 Mbps

DVC PRO 50

Norma de mostreig 4:2:2

 

Tarjetes P2

Panasonic. Estat sòlid. Permet molts formats.

 

 

  1. L’ALTA DEFINICIÓ

Actualment tant a Europa (DVB), com als EUA (ASTC) com al Japó (ISBN) es suporta la codificació de senyals comprimides sota els estàndards MPEG-2 i MPEG-4 AVC/H.264 i, per tant, tots suporten una resolució Full HD de 1920 x 1080 píxels

Definició estàndard

Resolució (SDTV – 720×540)

Relació aspecte 4:3

Distància de visionat 6 vegades l’altura de pantalla

Ample banda 170 Mbps, comprimit 4 Mbps

 

HDTV

Resolució (HDTV – 1920×1080)

Relació aspecte 16:9

Requereix distància de visionat 3 vegades l’altura de la pantalla

Ample de banda 900 Mbps, comprimit 20 Mbps

 

Escaneig entrellaçat i progressiu

Entrellaçat: cada fotograma es divideix en dues semi-imatges (camps) de la meitat de resolució vertical i aquestes es reprodueixen en lloc del fotograma sencer.

  • Redueix el parpelleig ja que passem de 25 fps a 50 camps.
  • Origen en la TV analògica. Menys adeqüat.

Progressiu: tot el quadre es reprodueix alhora

  • Comprimeix millor, fent redundat l’entrellaçat.
  • No genera artefactes (en passar d’entrellaçat a progressiu).

 

Resolucions HDTV

Ens indica el nombre de píxels en l’altura de la imatge (resolució vertical)

L’escaneig té molta importància. 720i 720p (1280×720),  1080i  1080p (1920×1080)

i = entrellaçat, p = progressiu

720p vs 1080i?         

  • Pràcticament mateix ample de banda.
  • 1080i artificis com interline twitter
  • Vertical subjectivament igual però resolució horitzontal lleugerament millor.
  • UER recomana 720p inicialment

1080p

  • La millor, però més requeriments tècnics i d’ample de banda
  • Ample de banda internet limita a 720p enlloc de 1080p
  • S’espera el 1080p 50/60p amb el temps s’imposi al 1080 50/60i
  • Permet obtenir els altres formats inferiors fàcilment i amb millor qualitat

 

Ultra High Definition (UHD)

Impulsat per NHK

Dos estàndards: UHD 2160 (3840×2160) i UHD 4320 (7680×4320)

Multiplica x16 la resolució del HDTV

Àudio multicanal fins 22.2

 


 

Cinematografia digital (d-cinema)

Originalment en analògic negatiu 35mm i màscara per retallar relació aspecte

Múltiples relacions d’aspecte al cinema, principals: 1.85:1 i 2.39:1

La resolució ens indica el nombre de píxels de l’amplada de la imatge (resolució horitzontal)

Càmeres cinematogràfiques específiques amb resolucions >HDTV (2k i 4k) a les que posteriorment s’aplica un retall en postproducció.

2K FA (2048 x 1356)    FA= full aperture

4K FA (4096 x 3112)

 

 

  Estàndard HDTV UHD
Resolució 720×540 1920×1080 (x1)

1280×720

7680×4320 (x4)

3840×2160(x2)

Ratio aspecte 4:3 16:9 16:9
Distància visionat/ altura pantalla 6 vegades 3 vegades 0,75 vegades
Angle visió horitzontal 13,3º 34º 100º
Ample de banda 170 Mpbs

(4 Mbps)

900 Mpbs

(20 Mbps)

 

 

 

 

 

 

 

 

Exercicis Resolució i Mida imatges

  • calcular la mida en cm d’una imatge de 512×512 px i 72 resolució.
    512 px / 72 ppi = 7,11 polzades * 2.54 = 18.03 x 18.03 cm
  • Full DIN A4 (210x297mm) escanejat amb resolució 300ppi
    mida imatge en polzades és 8,268 x 11,693
    8,268 polzades x 300 ppi = 2480 píxels
    11,693 polzades x 300 ppi = 3508 píxels
    Si canviem ara la resolució a 600ppi, quines són les noves mides en mm?
    doble resolució à meitat dimensions    (105x148mm)

 

ps-anys-anteriors

Leave a Reply