隔行扫描(也称为交错)是一种对
位图图像进行
编码的方法,通过
扫描或显示每行或每行
像素在
电子显示屏上“绘制”视频图像(另一种是
逐行扫描)的两种常用方法之一。
说明
原理
隔行扫描(Interlaced)是在显示设备表示运动图像的方法,每一帧被分割为奇偶两场图像交替显示,隔行扫描是一种减小数据量保证
帧率的压缩方法。
电视标准制订者考虑到交流电频率50或60Hz,所以确定了25或30fps的帧率(Frame rate),我国电视台标准为(PAL)制,指画面扫描50场每秒(每帧扫描2场画面,共25个奇场25个偶场)。两组25个字段一起工作,每1/25秒(或每秒25帧)创建一个完整的帧,两场图像构成一帧画面可以使带宽减小大约一半,但隔行扫描每1/50秒创建一个新的半帧(或每秒50个场) 。另外隔行扫描信号中的
伪像不能完全消除,导致帧之间会丢失一点信息。
编码方法
隔行扫描编码分两种:
允许使用宏块对结构编码为帧的图像,可以将一个帧宏块划分为两个场宏块进行编码;
2、图像自适应帧场编码(PAFF或PicAFF)
允许自由选择的图像混合编码为完整帧,将两场合并为一帧进行编码,或者将两场分别编码。
当图像同时存在运动区域和非运动区域时,由于PAFF自适应技术粒度太粗,无法实现满足更加精细的编码要求,于是在
H.264(MPEG-4第10部分高级视频编码(MPEG-4 AVC))便引出了宏块自适应帧场(
MBAFF)编码技术。
MBAFF对帧/场编码的选择是基于宏块的,其将两场合并为一帧进行编码,但将每一个帧宏块(16x16)划分为场宏块对(8*16),针对每一个帧宏块,编码器自动比较帧编码和场编码产生的码流大小,然后使用最节省码流的方式,并且可以避免产生
伪像。
目的
如果模拟广播电视系统采用25或30帧逐行扫描扫描方式显示,当电子束从屏幕的上半部分移到下半部时,屏幕上半部分的亮度就有了可以观察到的衰减,于是画面下半部分显得更亮。这只是一个瞬间,事实上最亮的部分(当然就是电子束刚经过的区域)会不断移动,从而产生闪烁现象。为防止闪烁,最佳的办法是加倍刷新率,改成60p扫描,将每幅画面扫描2次,因为在60分之一秒内,人眼能感觉到的亮度衰减就很小了。可是这样做,单位时间内扫描的总行数会加倍,那么水平扫描的速度就要加快。如此一来技术要求就会过高,以当时的条件做不到。于是标准制订者想到了一个折衷的办法,先花60分之一秒扫描奇数行(上场),然后再用后60分之一秒扫描偶数行(下场),两者互补成完整的画面。虽然扫描下场时,上场的亮度衰减了,但是由于亮暗的部分交织在一起,反而不易察觉。
使用隔行扫描可以让每秒可以显示更多的帧,每帧显示更多图像,使带宽减少,隔行扫描提供完整的垂直细节,具有逐行扫描所需的相同带宽,但具有两倍的感知
帧速率和
刷新率。与非隔行扫描的镜头(帧速率等于场速率)相比,这有效地使时间分辨率(也称为
时间分辨率)加倍。
无论是逐行扫描还是隔行扫描,都有视频文件、传输和显像三个概念,这三个概念相通但不相同。最早出现的是隔行扫描显像,同时就配套产生了隔行传输,而隔行扫视频文件是到数字视频时代才出现的,其目的是为了
兼容原有的隔行扫描体系(隔行扫描就是还依然在广泛应用)。
标识
格式标识符(如576i 50和720p 50)指定逐行扫描格式的帧速率,但对于隔行扫描格式,它们通常指定字段速率(帧速率的两倍)。这可能会导致混淆,因为行业标准的SMPTE时间码格式总是处理帧速率,而不是帧速率。为避免混淆,SMPTE和EBU总是使用帧速率来指定隔行格式,例如,480i 60是480i / 30,576i 50是576i / 25,1080i 50是1080i / 25。该惯例假设隔行扫描信号中的一个完整帧依次由两个场组成。
好处
屏幕截图,展示了去隔行扫描和隔行扫描图像之间的区别。
模拟电视中最重要的因素之一是信号带宽,以兆赫为单位。带宽越大,整个生产和广播链越昂贵,越复杂。这包括摄像机,存储系统,广播系统和接收系统:地面,有线,卫星,互联网和最终用户显示器(
电视和计算机监视器)。
对于固定带宽,隔行扫描为给定行数提供了两倍显示刷新率的视频信号(与逐行扫描相比)视频以类似的帧速率 - 例如1080i,每秒60帧半帧,而1080p每秒30帧全帧)。较高的刷新率改善了运动中物体的外观,因为它更频繁地更新其在显示器上的位置,并且当物体静止时,人类视觉组合来自多个相似半帧的信息以产生与所提供的相同的感知分辨率。通过渐进的全帧。如果源材料具有更高的刷新率,则此技术仅有用。电影电影通常以24fps记录,因此不会受益于隔行扫描,这种解决方案可将最大视频带宽降低到5MHz而不会降低60Hz的有效图像扫描速率。
给定固定带宽和高刷新率,隔行扫描视频还可以提供比逐行扫描更高的空间分辨率。例如,具有60 Hz场频的1920×1080像素分辨率隔行扫描
HDTV(称为1080i60或1080i / 30)具有与具有60 Hz帧速率(720p60或720p / 60)的1280×720像素逐行扫描HDTV类似的带宽。 ,但是对于低运动场景,空间分辨率大约是其两倍。
但是,带宽优势仅适用于模拟或未压缩的数字视频信号。对于所有当前数字电视标准中使用的数字视频压缩,隔行扫描引入了额外的低效率。。EBU已经进行了测试,表明隔行扫描视频相对于逐行扫描视频的带宽节省最小,即使帧速率提高了两倍。即,1080p50信号产生与1080i50(又名1080i / 25)信号大致相同的比特率,和1080p50实际上需要较少的带宽,以便在编码“运动”时主观上比1080i / 25(1080i50)等效更好。输入“场景。
在VHS以及使用旋转鼓在录像带上录制视频的大多数其他模拟视频录制方法都受益于隔行扫描。在VHS上,鼓每帧转动一整圈,并带有两个图像头,每个图像头在每次旋转时扫描一次磁带表面。如果设备用于记录逐行扫描视频,则磁头的切换将落在图像的中间并显示为水平频带。隔行扫描允许切换发生在图像的顶部和底部,标准电视机中的区域对于观看者是不可见的。该设备也可以比每次扫描记录全帧时更紧凑,因为这需要双倍直径的鼓以角速度的一半旋转,并在磁带上进行更长,更浅的扫描以补偿每次扫描的双倍线数。然而,相同的图像区域,基本上将垂直分辨率减半,直到播放进行。另一种选择是在实际停止磁带之前按下暂停按钮捕获一个完整的帧(两个字段),然后从帧缓冲区重复再现它。后一种方法可以产生更清晰的图像,但是通常需要一定程度的去隔行以获得显着的视觉效果。虽然前一种方法会产生朝向图像顶部和底部的水平伪影,因为磁头不能沿着磁带表面精确地穿过与在移动磁带上记录时完全相同的路径,但这种不对准实际上会随着逐行记录而变差。
隔行扫描可用于制作3D电视节目,特别是对于
CRT显示器,尤其是对于彩色滤光眼镜,通过在交替场中传输每只眼睛的彩色键控图像。这不需要对现有设备进行重大改动。快门眼镜也可以采用,显然需要实现同步。如果使用逐行扫描显示来查看这种编程,则任何对图像进行去隔行扫描的尝试都会使效果无效。对于彩色滤光眼镜,图像必须是缓冲的并且显示为具有交替的彩色键控线的渐进式,或者每个场必须被线性加倍并显示为离散帧。后一种程序是在逐行显示器上适合快门眼镜的一种方法。
历史
历程
当开发电影胶片时,必须以高速率照亮电影屏幕以防止可见的
闪烁。所需的确切速率因亮度而异 - 在昏暗的房间内可接受40 Hz,而对于延伸到周边视觉的明亮显示器,可能需要高达80 Hz。胶片解决方案是使用三叶片快门将每帧胶片投影三次:以每秒16帧的速度拍摄的电影每秒照亮屏幕48次。之后,当声膜变得可用时,每秒24帧的更高投影速度使得双叶片快门能够产生每秒48次的照明 - 但仅限于投影仪无法以较低的速度投射。
此解决方案不能用于电视。要存储完整的视频帧并将其显示两次,需要帧缓冲器 -电子存储器(
RAM) - 足以存储视频帧。直到20世纪80年代后期,这种方法才变得可行。此外,避免工作室照明引起的屏幕干扰模式和
真空管技术的限制要求以
交流线路频率扫描电视的CRT。(这在美国是60赫兹,50赫兹欧洲。)
在机械电视领域,LéonTheremin展示了隔行扫描的概念。他一直在开发一种基于镜鼓的电视,从1925年的16行分辨率开始,然后是32行,最后在1926年使用隔行扫描64。作为他的论文的一部分,他在1926年5月7日电传输并投射近同步在五英尺见方的屏幕上移动图像。
1930年,德国Telefunken工程师FritzSchröter首先制定了将单个视频帧分解为隔行扫描线的概念并申请了专利。在美国,RCA
工程师Randall C. Ballard在1932年获得了同样的想法。商业实施始于1934年,因为
阴极射线管屏幕变得更亮,增加了由
渐进(顺序)引起的闪烁水平扫描。
1936年,当英国制定模拟标准时,CRT只能在1/50秒内扫描大约200行。使用交错,可以叠加一对202.5线场,以成为更清晰的405线框。
垂直扫描频率保持50 Hz,但可见细节明显改善。结果,该系统取代了当时也使用的John Logie Baird的240线机械逐行扫描系统。
从20世纪40年代开始,技术的进步使得美国和欧洲其他国家采用逐渐增加带宽的系统来扫描更高的线数,并获得更好的图像。然而,隔行扫描的基本原理是所有这些系统的核心。美国采用称为
NTSC的525线路系统,欧洲采用625线路系统,英国从405线路系统切换到625线路,以避免开发独特的彩色电视方法。法国从其独特的819系统切换到625的更欧洲标准。虽然术语PAL通常用于描述电视系统的线路和帧标准,这实际上是不正确的,并且仅指在标准625线路广播上叠加颜色信息的方法。法国采用了他们自己的
SECAM系统,其他一些国家也采用了该系统,特别是俄罗斯及其卫星。PAL已被用于其他一些NTSC广播,特别是在巴西。
直到20世纪70年代,当计算机监视器的需求导致重新引入逐行扫描时,隔行扫描无处不在。Interlace仍然用于大多数标准清晰度电视和
1080iHDTV广播标准,但不适用于LCD,微镜(
DLP)或大多数
等离子显示器;这些显示器不使用
光栅扫描来创建图像,因此不能从隔行扫描中受益:实际上,它们必须用逐行扫描信号驱动。在
去隔行从正常的隔行广播电视信号获得逐行扫描的电路可能增加使用这种显示器的电视机的成本。当前渐进式显示器在HDTV市场中占主导地位。
计算机为何不使用隔行扫描
在20世纪70年代,计算机和家庭视频游戏系统开始使用电视机作为显示设备。此时,480线
NTSC信号远远超出低成本计算机的图形处理能力,因此这些系统使用简化的视频信号,使每个视频场直接扫描在前一个视频上,而不是两条线之间的每条线。以前的字段。这标志着自20世纪20年代以来从未见过的逐步扫描的回归。由于每场成了自己的,现代术语一个完整的框架将调用此240P的NTSC套,以及288P的PAL。虽然允许消费者设备创建此类信号,但广播法规禁止电视台像这样传输视频。诸如CGA的计算机监视器标准进一步简化为NTSC,其通过省略颜色调制来改善图像质量,并允许计算机的图形系统和CRT之间的更直接连接。
到20世纪80年代中期,计算机已超出这些视频系统并需要更好的显示器。的苹果IIGS从使用旧的扫描方法的遭遇,具有最高的显示分辨率为640X200,产生严重失真的高窄
像素形状,使得现实匀称图像的显示困难。各公司的解决方案差异很大。由于PC监视器信号不需要广播,因此它们消耗的带宽远远超过NTSC和PAL信号所限制的6,7和8
MHz带宽。IBM的
单色显示适配器和增强型图形适配器以及Hercules图形卡和原始
Macintosh计算机生成的视频信号接近350p。所述准将Amiga的创建真正的隔行480i30 / 576i25
RGB信号,适合于NTSC / PAL编码。这种能力导致Amiga在视频制作领域占主导地位直到20世纪90年代中期,但隔行扫描显示模式导致需要单像素细节的更传统PC应用的闪烁问题。1987年引入了VGA,很快就将PC标准化了,几年后苹果公司只推出了Mac标准,当VGA标准进行了改进,以匹配1987年推出的Apple专有的24位彩色视频标准。
在20世纪80年代末和90年代初期,显示器和显卡制造商推出了新的高分辨率标准,再次包括隔行扫描。这些监视器以非常高的刷新率运行,意图这将减轻闪烁问题。这种监视器非常不受欢迎。虽然起初闪烁并不明显,但眼睛疲劳和缺乏焦点仍然是一个严重的问题。该行业很快就放弃了这种做法,在过去十年的剩余时间里,所有监督者都保证他们所声明的决议是“非交错的”。这种经验就是为什么至二十一世纪PC行业仍然反对高清电视的交错,并游说720p标准。此外,业界正在游说超过720p,实际上是NTSC传统国家的1080 / 60p,以及PAL传统国家的1080 / 50p。
扫描区别
每一帧
图像由电子束顺序地一行接着一行连续扫描而成,这种
扫描方式称为
逐行扫描。把每一帧
图像通过两场扫描完成则是隔行扫描,两场扫描中,第一场(
奇数场)只扫描奇数行,依次扫描1、3、5…行,而第二场(偶数场)只扫描偶数行,依次扫描2、4、6…行。隔行扫描技术在传送信号带宽不够的情况下起了很大作用。
视频文件
摄像机的
采像,从一开始其实不存在扫描,因为无论是胶片还是电子原件都是同时受光的。但是,要读取感光器上的信息(其核心任务将画面采样为YUV/RGB电信号),还是要靠扫描,于是读取每个像素的顺序就必须考虑。可以采取按顺序依次读取(逐行方式),也可以每行按顺序读取,但是先读完所有
奇数行再读偶数行(隔行方式)。为了兼容电视机的隔行扫描体系,过带机(将胶片上的画面采样为YUV/RGB电信号并保存在磁带上的机器)和有些摄像机是隔行扫描制式的。当然也有逐行制式的产品。
当人们学会用电子原件感光和用数字化的
计算机文件保存视频时,数字摄像机就实用化了。事实上用数字信息保存的依然是YUV/RGB电信号,只是变换了个介质,本质上没什么区别(这里指的是未压缩的视频,经过压缩后就大不一样了)。
但在计算机中,不管接到的是逐行还是隔行信号,都会按顺序逐一写入文件,不特别区分。如此一来,计算机上的视频,以逐行和隔行信号为讯源的文件肯定有区别,它们分别称为
逐行扫描和隔行扫描视频。
交错视频
随着全球流行的
广播电视的出现,制片人意识到他们需要的不仅仅是
电视直播节目。便转向电影、电视剧、新闻、短视频等原创材料回放,然而低帧率视频文件对于高帧率回放设备之间的
帧速率(
刷新率)差异意味着简单地将电影播放到电视摄像机中会闪烁。因此需要进行一些插帧或帧复制让场同步(
垂直同步),但是如果录制的视频文件帧率高于回放设备,只需要丢帧到广播电视标准即可。
通常通过使用平滑(插值算法)而不是帧复制算法(例如3:2下拉等)来实现最佳结果,以调整电影和视频帧速率之间的速度差异。
使用
垂直同步防止屏幕撕裂时会出现类似问题,这是帧速率不匹配时遇到的另一个问题。
2:2下拉
在使用PAL或
SECAM视频标准的国家,用于电视的电影以每秒25帧的速度拍摄。PAL视频标准以每秒25帧的速度播放,因此从电影到视频的转换很简单;对于每个电影帧,捕获一个视频帧。
最初以24帧/秒拍摄的戏剧特征以25帧/秒显示。虽然在图片中通常没有注意到这一点(但是在动作速度期间可能会更加明显,特别是如果拍摄的片段被拍下来),播放速度增加4%会导致音频音调稍微明显增加,仅超过0.679
半音,这是有时使用音高变换器进行校正,尽管音高变换是最近的创新并取代了25帧/秒格式的替代电视电影方法。
2:2 pulldown也用于转移节目和电影,以每秒30帧的速度拍摄,就像
Friends和
Oklahoma!(1955年电影)到
NTSC视频,其具有60Hz的扫描速率。
虽然从PAL和SECAM电视的早期开始,4%的速度增加已经成为标准,但最近新技术已经普及,并且所得到的电视节目的速度和音调与原始电影的相同。
这种下拉方法有时用于将24帧/秒的材料转换为25帧/秒。通常,这涉及到没有上述4%加速的胶片到PAL传输。对于24帧/秒的电影,每25帧PAL视频有24帧胶片。为了适应帧速率的这种不匹配,必须在50个PAL场上分配24帧胶片。这可以通过每12帧插入一个下拉场来实现,从而有效地在PAL视频的25个场(或“12.5帧”)上传播12帧胶片。使用的方法是2:2:2:2:2:2:2:2:2:2:2:3(欧元)下拉(见下文)。
这种方法源于对更快,更高音调的音轨的挫败感,这些音轨传统上伴随着传输给PAL和SECAM观众的电影。一些电影开始以这种方式电视电影。它特别适用于配乐特别重要的电影。
当NTSC区域中的电视台播放使用PAL打印/版本但正在以NTSC格式广播的电影或节目时,有时它们不执行适当的PAL到NTSC下拉转换,或者它不正确地完成。由于PAL 576线路/ 50 Hz与NTSC 480线路/ 60 Hz格式的速率更快,因此程序会略微加速和/或声音更高音调。
一些DVD版本的电视节目/电影,如The Archie Show,其剧集以NTSC格式播出,但大师们在使用时丢失或损坏,使用PAL 576/50打印,3:2下拉尚未播出正确执行,导致更快的胶片速度和更高的音高。虽然几集中的一些场景使用NTSC镜头,因为PAL母版丢失,并且镜头在使用中受损,导致速度,音高和胶片质量的变化。
2:3下拉
在美国和其他电视使用59.94 Hz垂直扫描频率的国家,视频以29.97帧/秒的速度播出。为了在视频信号上精确地呈现电影的运动,电视电影必须使用称为2:3下拉的技术,也称为3:2下拉,以从24转换为29.97帧/秒。
术语“下拉”来自在传送机构的薄膜部分内向下“拉动”(物理移动)薄膜的机械过程,以重复的速率(标称为24帧/秒)将薄膜从一帧推进到下一帧。 。这分两步完成。第一步是将胶片运动减慢1/1000至23.976帧/秒。观察者察觉不到速度的差异。对于一部两小时的电影,播放时间延长了7.2秒。
2:3下拉的第二步是将电影帧分配到视频场中。在23.976帧/秒时,每5帧29.97帧/秒视频有4帧胶片:
23.97/29.97=5/4
通过利用60Hz视频的
隔行特性,这四个帧被“拉伸”为五个。对于每一帧,实际上存在两个不完整的图像或场,一个用于图像的奇数行,一个用于偶数行。有,因此,对于每四个胶片帧,这是所谓的十个字段甲,乙,Ç,和d。电视电影交替地将A帧放置在两个场中,B帧跨越三个场,C帧跨越两个场,D帧跨越三个场。这可以写成AABBBCCDDD或2-3-2-3或简单地2-3。在四个胶片帧曝光后,循环完全重复:
3:2模式与上面所示模式相同,只是它移动了一帧。例如,以胶片帧B开始的循环产生3:2模式:BBBCCDDDAA或3-2-3-2或简单地3-2。换句话说,2-3和3-2模式之间没有区别。实际上,“3-2”符号具有误导性,因为根据SMPTE标准,每个四帧电影序列的第一帧被扫描两次,而不是三次。
上述方法是“经典”2:3,它在帧缓冲区允许保持多于一帧之前使用。执行2:3的首选方法每五个中只创建一个脏帧(即3:3:2:2或2:3:3:2或2:2:3:3);虽然这种方法有更多的
抖动,但它允许更容易的上转换(丢弃脏帧而不丢失信息)和编码时更好的整体压缩。松下DVX-100B摄像机支持2:3:3:2模式,名称为“Advanced Pulldown”。请注意,只显示字段 - 没有帧,因此没有伪帧 - 在隔行显示中,例如在CRT上。在显示隔行扫描视频的其他方法中可能出现伪帧。
其他下拉模式
对于以低于24帧/秒的“静音速度”拍摄的电影必须使用类似的技术,其中包括家庭电影格式(标准8毫米胶片的标准是16 fps,以及Super 8 mm胶片的18 fps)以及无声电影(35毫米格式通常为16 fps,12 fps,甚至更低)。
此外,已经描述了其他模式,其涉及在逐行显示器(例如,LCD或等离子体)上显示24帧/秒视频(例如,来自DVD播放器)所需的
逐行帧速率转换:
反交错
有交错就有
反交错。所有隔行扫描视频在计算机播放都进行
反交错,只有那些自带反交错的电视才不需要这么做。
有几种去隔行扫描方法。
场组合去隔行
场组合去隔行,将偶数场和奇数场组合成一帧。这将感知的帧速率(时间分辨率)减半,从而将 50i 或 60i 转换为 25p 或 30p。
场扩展去隔行
半尺寸显示每个隔行扫描场本身,导致视频的原始垂直分辨率的一半,未缩放。虽然这种方法保留了所有垂直分辨率和所有时间分辨率,但由于其假长宽比,因此可以理解地不用于常规观看。然而,它可以成功地用于应用期望非交错帧的视频滤波器,例如利用来自相邻像素的信息的那些(例如,锐化)。
线加倍
线加倍取每个交错场的线(仅由偶数或奇数线组成)并使它们加倍,填充整个帧。这导致视频具有与场速率相同的帧速率,但是每个帧具有垂直分辨率的一半,或者分辨率等于构成帧的每个场的分辨率。线倍增可防止梳状伪影,但会导致图像质量明显降低,因为显示的每帧都加倍,实际上仅在原始半场分辨率下。这在静止物体上很明显,因为它们看起来像是上下摆动。这些技术也称为bob去隔行和线性去隔行出于这样的原因。线倍增保留了水平和时间分辨率,但牺牲了垂直分辨率和静止和较慢移动物体上的浮雕伪影。该方法的变体丢弃每帧中的一个场,使时间分辨率减半。
线加倍有时与一般的去隔行或
插值(图像缩放)相混淆,
插值使用空间滤波来产生额外的线,从而降低像素化在任何类型的显示器上的可见性。术语“line doubler”在高端消费电子产品中使用得更频繁,而“去隔行”则更频繁地用于计算机和数字视频领域。
动作检测
通过结合传统的场组合方法(编织和混合)和帧扩展方法(bob或线加倍)来创建高质量的逐行视频序列,可以确保最佳图像质量;最好的算法也会尝试预测后续子场之间的图像运动的方向和数量,以便更好地将两个子场混合在一起。
方向和运动量的基本提示之一是隔行扫描信号中的梳状伪像的方向和长度。更高级的实现将采用类似于视频压缩中使用的块运动补偿的算法;使用这种技术的去隔行扫描仪通常更优越,因为它们可以使用来自许多领域的信息,而不是仅仅一两个。这需要强大的硬件来实现实时操作。
例如,如果两个字段的人脸朝左移动,则编织将创建梳理,并且混合会产生重影。高级运动补偿(理想情况下)会看到几个场中的脸部是相同的图像,只是移动到不同的位置,并试图检测这种运动的方向和数量。然后,算法将尝试通过将图像组合在一起来重建两个输出帧中的面部的全部细节,沿着检测到的方向移动每个子场的部分移动检测到的移动量。
运动补偿需要与场景变化检测相结合,否则它将尝试在两个完全不同的场景之间找到运动。实现不良的运动补偿算法会干扰自然运动并且可能导致视觉伪像,其表现为应该是静止或平滑运动图像的“跳跃”部分。