绪论:写作既是个人情感的抒发,也是对学术真理的探索,欢迎阅读由发表云整理的11篇解码技术论文范文,希望它们能为您的写作提供参考和启发。
总体结构
系统硬件分为:高清图像采集板、NiosII核心板、单片机接口板三部分。软件由NiosII和单片机软件组成。考虑到程序的标准化、可移植性,NiosII程序和单片机程序都使用标准C编写。
高清图像采集
方案一用工业用高清镜头采集影像,再对模拟视频解码,得到高清视频数据。解码芯片可选AD的ADV7181C,10位集成多格式标清高清视频解码器,四个10位ADC采样速率最高110MHz,支持720p/1080i高清分量,最高对1024x768、70Hz(XGA)RGB图形进行数字化处理。科技论文。或TI TVP5150AM1,超低功耗优化架构,工作状态下功耗仅为113mW,只需一个晶振就能支持所有标准,可通过I2C对亮度、对比度、饱和度、色调、锐度等控制,功能强大使用方便。或飞利浦SAA7114H,该芯片最多允许6个复合视频输入,显示比例调整分辨率调整,解码精度高支持视频窗口缩放。科技论文。此方案成本高体积大。
方案二用高清图像传感器采集,直接输出高清图像数据。从芯片的性能指标、价格供货、技术支持、开发难易程度等方面考虑,Omni公司的OV9712芯片较为合适。该传感器为1/4”标清高清CMOS图像传感器,像素尺寸3.0um,内置OmniPixel3-HS技术,可提供WXGA(1280X800)分辨率、640x480、HD720p三种格式图像,10bit彩色rawRGB并行图像数据输出,PLL锁相环,高信噪比图像质量,镜头校正,画面缺陷补偿。该方案成本百元左右,硬件简单性能稳定,符合实际要求。
设计OV9712采集电路时,要使用独立电源,电路板上尽量减小信号线长度及避免上下层平行布线,电源芯片放在板子外侧。外围器件尽量以OV9712要求参数一致,电路中模拟地与数字地分开走线最后汇集一点。OV9712有效图像传感区域不在芯片中间位置,而是偏右偏上,为了使目标图像能处于画面中心,绘制电路板时要注意调整芯片位置,具体尺寸参见OV9712器件手册。
Nios核心板
FPGA芯片选型比较如下:
1 MIMO技术的发展
多输入多输出技术的核心在于空间复用编码,空间复用系统中独立的数据流是由不同的天线在同一时间发送,信道容量直接因为发送天线的增加而线性增加。本论文主要讨论空间复用编码及其相关检波技术,具体比较了线性检测、非线性检测和树查找三种检波算法。
2 系统模型
通常的MIMO系统2×2、2×4或4×4的天线系统,一般设定Nr大于或等于Ns。这样做的目的是第i个数据流xi在第i根天线上发送时,接收到的信号向量r=Hx+n,这样Ns×1的发送数据流列向量右乘Nr×NS的信道传输矩阵H,加上Ns×1的信道噪音列向量。设定传送的数据系列x服从(0,σ2)的高斯分布,为了简化系统仿真中直接在接收端导入信道传输矩阵H,噪音为高斯白噪。
3 空间复用和检波技术
OFDM系统发展到今天,加入时空编码成为在不增加现有带宽基础上稳定提高传输速率的最好手段。包括线性递推法和树查找法的接收器检波技术实践中用来移除信道的干扰,恢复被频选信道干扰的信号的正交性等,但是其计算太繁琐。因此陆续的出现球形译码算法和QRD-M算法既继承了最大相似性算法的优势又减少了计算量,节约了处理芯片功耗。
3.1 ZF接收器
ZERO-FORCING接收器在接收天线数大于或等于发送天线数的条件下,使信号传输方程:
成立的向量解并不唯一,因此需要找最小方差的发送信号向量,利用微分找到最小方差值为:
从上面公式可以看出,在信号的解调基本是信道传输函数的线性运算,因此ZF接收器在信道情况良好的情况下就会非常方便和快捷,利用线性矩阵运算可以很简单地建立运算函数,如图1所示。
3.2 V-BLAST译码
虽然线性的接收器非常容易实现,但是因为增加了信道传输函数阶数且需要的信道良好条件在实际高楼密集的城市中很难实现,贝尔实验室在1996年提出了一种无线通信中多天线的空间结构,称为D-BLAST,进而在1998年,P. Wolniansky联合Goschini和 Golden在D-BLAST的时空编码中实现高传输率的垂直-BLAST,即V-BLAST,V-BLAST在信元调制中使其时空编码先正交,这样每次减少一个发送的信元的同时减少信道传输函数的阶数,即将最初的r×t,依次减少到r×1,也就是SIC算法。利用ZF或是MMSE矩阵来调制信元xi,从而使得接收信号在接收端通过ZF或是MMSE相同的矩阵运算后只留下xi的信号成分,从而提取出发送的信元xi,再将提取出的成分反馈回接收器线性元素之后,再重复步骤提取xi+1。
3.3 利用QR分解法分解信道矩阵
利用QR分解法将r×t的信道传输函数矩阵H分解为与转秩相逆的矩阵Q和上对角矩阵R,即QTQ=E,接收到的信号为:
基本所有的多输入多输出正交频分多路复用都会在检测算法中或多或少使用到QR分解法,当QR分解之后的信道响应不仅能保证信号的正交而且还能够简化信号的解调处理。因为信道的传输函数H分解为了上三角矩阵R,各信号分量矩阵间的相互关联也被简化为上三角矩阵中各信号单独的向量调制,从而简化接收端同步检测器的设计复杂度,如图2所示。
3.4 树搜索同步技术
最大似然法利用已知的模型来推导未知的参数,在MIMO-OFDM系统中使用的最大似然法利用树搜索,每一个搜索树节点作为信元的可能解码。下面将对两类常用的搜索树的优缺点继续比对
3.4.1 球形解码
MIMO接收端天线数量的增加会使算法的复杂度成指数增加,很难在大阵列和高调制数的情况下物理实现解码器。球形解码算法利用合理的译码半径R从而判定接收好译码的路径d,约束搜索半径R的公式一般写为:
球型解码器由前端运算部件和后面的树搜索部件构成。
5 结论
该论文中讨论了多输入多输出信道模型下的多个解码算法,通过MATLAB仿真软件讨论各算法下不同的信噪比和算法复杂度。通过MATLAB所生成的图形,我们可以明显看到因为零点逼近算法采用的放大滤波器在放大有效信号的同时也相应地放大了噪音信号,因此其在信噪比一定的情况下比其他算法所产生的误码率高。采用递推算法的垂直-BLAST解码算法对比零点逼近算法来说其误码率有所改进,但是其改进的地方在于采用了QR算法来分解信道矩阵,因此其对于零点逼近算法的改进基本取决于QR分解算法的阶数。最接近于最大近似算法的误码率,且比最大近似算法更为简单的球型算法作为现代MIMO-OFDM信道解码的主流算法存在很高的可操作性和理想的低误码率。
参考文献
[1]Bohnke,R.,D.Wubben,“BLAST结构的时空编码”,IEEE Tran.Vol.50,2003.
[2]G.Foschini,“多天线衰减环境下无线通信的时空结构层结构”,Bell Labs, Technical Journal 2,1996.
[3]P.Wolniansky,G.J.Foschini,G “V-BLAST”,URSI Inter-national Symposium on Signals,Systems and Electronics,1998.
[4]Gentle,J.E.,“QR分子”,1998.
[5]Vikalo,H.,B.Hassibi,“球型约束下频选信道的最大似然检波器”,IEEE vol.54 2006.
作者简介
中图分类号:TP311 文献标识码:A文章编号:1007-9599 (2011) 20-0000-02
Mp3 Player Design Based on SOPC
Xie Huicheng1,Guo Li2
(1.School of Electronic Engineering,Jiujiang University,Jiujiang332005,China;2.Jiujiang University,Information Science and Technology College,Jiujiang332005,China)
Abstract:This paper mainly from the audio playback and the intersection of SOPC technology,this paper proposes the use of technology in Altera's SOPC CyelonII EP2C35 FPGA mp3 player built on the design.The use of IP design reuse,collaboration software and hardware,hardware acceleration and other methods,combined with the experimental characteristics of platform resources to build a soft-core processor based on NiosII mp3 player system. Achieve MPEGⅠ layerⅢ smooth playback audio decoding.The system has a small size,design flexibility,short development cycle and so on.
Keywords:Embedded system;SOPC;MP3 player
一、引言
目前,嵌入式系统进入全面应用的阶段,己经成为通信和消费类产品的共同发展方向。在硬件方面,市场上不仅有各大公司生产的各种微处理器芯片,还有用于学习和进行研发的各种配套的软件开发包和开发工具。SOPC具有系统集成度高、体积小、功耗低、结构简洁、可靠性高、开发快速等特点,很好的满足了的嵌入式系统在硬件上的需求。SOPC技术的目标是试图将尽可能大而完整的电子系统,包括嵌入式处理器系统、接口系统、硬件协处理器或加速器系统、存储电路、DSP系统、数字通信系统、以及普通数字系统等,在单一FPGA中实现,使得所设计的电路系统在其规模、可靠性、体积、功耗、功能、性能指标、上市周期、开发成本、产品维护及其硬件升级等多方面实现最优化。
二、系统总体设计
设计一个具有基本功能的MP3播放器需要有时钟电路、CPU、RAM及RAM控制器、Flash及Flash控制器、SD卡及SD卡控制电路、液晶及液晶显示器驱动电路、DMA控制器、音频驱动及音频控制电路、定时器等模块,如图1所示。
图1:MP3播放器系统结构图
除显示驱动模块、音频控制模块和SD卡控制模块外其他模块都可以从SOPC Builder中添加IP核构建。
其中显示驱动模块可以在altera提供的VGA控制器的基础上添加CLK和BLANK信号完成;SD卡控制模块只需要定义几个GPIO端口就可以了,不需要单独设计。
三、音频播放模块
采用的MagicSOPC实验开发平台配有AC97音频解码模块,主控制芯片为UCB1400(带有触摸屏功能的立体声音频编解码器),它支持可编程抽样率、输入/输出增益和数字音响处理,包括音量、静音、低音和高音控制。
音频控制模块是CPU与UCB1400间的接口电路,功能为将缓存中的音频数据通过AC-Link总线发送到UCB1400的DAC输入端口实现音乐的播放,以及由AC-Link总线接收UCB1400采集的音频编码数据。本设计采用verilog语言来设计如下各个功能模块。
(一)UCB1400寄存器访问控制
音频播放时主控制器(CPU)需要经常读/写UCB1400中相关的寄存器,因为采用AC-Link串行总线传输数据,时序变得非常重要,所以定义了访问控制模块。要访问UCB1400时,该模块向UCB1400发送请求信号;当一次读取完成,数据准备好时,该模块向CPU发送反馈信号。
(二)UCB1400掉电模式控制
UCB1400可以将暂时不用的模块关闭以节约功率,向UCB1400的Power-down Control/status Register(0x26)写入相应的数值可以控制UCB1400中各个模块的开启和关闭。所以设计掉电模式控制模块,该模块负责监视UCB1400各模块的状态并将此信息反馈给主控制器。
(三)串行输入/输出寄存器
FPGA内部数据为并行传输,而与UCB1400间则功过AC_Link总线串行传输,所以应设计串并转换模块。
(四)输入/输出FIFO
为保证音乐播放的流畅,应为每个声道配置一定容量的FIFO用来保存已接收到和即将传输的数据。
设计完成后的AC97_Controller结构框图如图2所示:
图2:AC97_Controller结构图
具有如下功能:
可变比特率支持、双声道立体声输出支持、双声道立体声输入支持、单声道麦克风输入支持、DMA传送方式支持。
四、系统软件设计
将基于NiosⅡ的SOPC系统进行编译并下载到FPGA中生成硬件系统的同时,SOPC Builder帮助用户生成相应的SOF文件。在此基础上,可开始系统软件的设计。可使用汇编、C、C++来进行嵌入式程序设计,使用IDE工具进行程序的编译连接以及调试。MP3播放器的软件系统结构如图3所示:
图3MP3播放器软件系统结构
五、结语
本系统采用SOPC技术在一片FPGA和少数外设上实现了MP3播放器的基本功能。在50MHz的系统时钟下实现了MPEG-Ⅰ layer-Ⅲ解码,流畅播放MP3格式的音频文件。
SOPC方案的优势在于系统功能改进的灵活性,在不改变硬件平台的情况下,可以方便对系统进行增删和优化,这是传统ARM方案无法达到的。
参考文献:
论文摘要:医疗器械的发展经历了从最早的仅仅满足使用需求到现在需要满足使用者内心感受的巨大变革,同时对于医疗器械设计理念在不同时代也给予了不同的定义,当今社会所追求的物质与精神的统一决定了医疗器械设计也必须从外观设计转向涉及使用者内心感受的交互式设计阶段,这是科技与人,历史与发展结合的必然产物。交互式设计在医疗器械中的作用,旨在思考机器与人,人与机器的和谐发展。
二十世纪二、三十年代包豪斯提出的“功能主义”在工业设计中影响很大,医疗器械的设计有相当长一段时间以“理性主义”思潮为主流,遵循“形式追随功能”原则,其“技术至上”的倾向导致了产品与人的情感、与环境的疏远。这种高估 “物”的技术作用,而忽视“物”的人文价值的作法,是不符合当今时代要求的。
我国医疗器械产品技术除在超声聚焦等少数领域处于国际领先水平外,多数关键技术被发达国家大公司所垄断,国产高端医疗器械产品技术性能和质量水准落后于国际先进水平10年左右。与此同时,将产品的“设计”行为视为或从事为“装饰”行为,仍是我国企业中医疗器械设计的主流。这种认识和行为上的肤浅化、歪曲化,正使相当多的企业遭受严重的短期损失(如产品积压)和长远损失(如失去市场)。
一、设计对话——作品与受众的信息交流
医疗器械的交互式设计在于有效地传递产品与服务的信息,树立良好的品牌形象与企业形象,刺激消费者的购买欲望,并从精神上给人以美的享受,最后达到推动经济发展的目的。这就要求设计师在设计创新的时候需要考虑到产品与消费者之间的这种对话,以保证产品生产投入市场之后可以获得较好的市场认同度。从而也在一定程度上促进设计的发展。
设计师根据市场竞争态势与消费者需求趋向等信息来确定设计作品的开发与传播,同样,消费者作为设计信息终端部位的信宿,是设计信息的接受者,他在接受信息时必须经过解码过程。对于设计师而言,就需要在设计创新的过程中进行思考,来规划这一个解码的过程。
对于设计受众来说,信息的解码过程大体可分为注意、识码、分析、记忆、行动几个阶段。当设计作品引发他们关注时,才能产生审美注意,设计信息引起注意是信宿接受信息,解码过程的开始,当解读相关信息后,也就获得了某种设计信息。了解了产品的性能、特点,感受到它的造型、质量。联想到对提高自己生活品质的利益和好处,从而在心理上缩短了与产品的距离,萌生一种拥有的欲望。识码、分析是设计信息解码过程的主体,是信息的接受与处理。设计信息作用的实现就从这里开始,因此也是很重要的。记忆,行动是设计信宿解码过程的完成,于是设计活动与设计对话就在这种双向信息交流中开始与终结。在设计的创新阶段,设计师可以针对不同的产品进行相应有效的注意、识码、分析、记忆、行动的针对性预设计,从而为这个结果的实现提供前提。
二、多维思考
医疗器械的交互式设计在明确命题之后,具体实践的过程则要求进行多维思考。所以在设计创新和开发阶段,设计师从多维角度考虑出发,在避免重复传统的无序思维发散的基础上,为达到医疗器械交互设计在设计开发之后能准确的与市场消费需求相吻合而充分的实现附加值的最大化,定位情感消费与设计开发相结合方法,还需要提出一些基于命题和市场的概念描述:
1.辅助物:现阶段对医疗器械的交互式设计需求注重的是情感上的共鸣,辅助物是一个玩具亦或一个玩伴甚者一种友谊,一种美好的心情。
2.适用人群确立:有想法、充满了想象力、勇于尝试和创新,对现行交互式设计文化耳濡目染,关心自己,关心他人,重视生活,物质和精神的双重需求。
3.共性与个性:或许是某个按键、表面、质感、颜色与使用者产生共鸣。
有了这样的概念性描述之后,基本上明确了医疗器械的交互式设计导向,也就为下一步工作做好了充分的准备。
三、设计效用性
由于现代设计信息创意水平的提高,企业整体营销战略的加强,一般有远见卓识的企业传播的设计信息都具有长期效果,对受众起着举一反三的作用,并使其获得经济,艺术与审美的多种效应。而在创意上这种长期的有效性就表现为对设计产品创意程度的应用。产品的周期决定了产品的寿命,创意是这一产品在市场上的卖点。可以通过对效用性的研究,来分析特定产品在特定情况下的设计过程和实现的方法。
中图分类号:TP331文献标识码:A文章编号:1009-3044(2009)25-7245-02
A SoC Architecture Design of Hardware Decoder of AVS
XU Xiao-ni, YAN Xiang-hong
(College of Information Science and Engineering, SDUST, Qingdao 266510, China)
Abstract: According to the algorithm of AVS audio and video decoding standard, this paper proposes a proposal of AVS decoding based on SoC method. This method can reduce the complexity of AVS decoder effectively. Using the hardware and software co-design ideas can reduce the difficulty of designing a decoder while improving the flexibility of decoding.
Key words: AVS; SoC; hardware and software co-design; decoding
AVS(Audio Video coding Standard)[1]是由中国信息产业部成立的“数字音视频编解码技术标准工作组”提出的我国自主制定的数字音视频编解码技术标准,是为了适应数字电视广播、数字存储媒体、网络流媒体、多媒体通信等应用中对运动图像压缩技术的需要而制定的。AVS标准中的解码后的视频质量介于MPEG2和H.264之间,但AVS标准的编码复杂度和效率要好于H.264标准,而且相对H.264较高的专利许可费用,AVS采用了非常低的专利许可费。2006年初,国家信息产业部正式批准AVS标准成为中国音视频领域的国家标准,从而为国内企业每年节省大量的专利许可费用。
目前在嵌入式设备上,音视频的硬件编解码器都采用ASIC的设计方案,即全部采用硬件实现音视频标准的所有部分。这种方案的设计优点是解码速度快,但同样缺点也是明显的,即它的研发时间长、成本高、灵活性低,而且编解码格式固定,无法进行升级。而SoC(System on chip)[2]的设计方案能够满足音视频领域要求的编解码速度,同时还能够加快研发速度、降低成本,而且灵活性高,可升级(设计部分只针对软件方面),因此相对ASIC的设计方案,采用SoC的设计方法有很大的优势。
1 SoC设计方法介绍
SoC(System on chip)[2]简称片上系统,是一个有专用目标的集成电路,其中包含完整系统并有嵌入软件的全部内容,包括CPU、程序存储器、IP(intellectual property)功能复用模块、片外总线接口模块。同时它又是一种技术,用以实现从确定系统功能开始,到软/硬件划分,并完成设计的整个过程。SoC设计的关键技术主要包括总线架构、IP核可复用、软硬件协同设计等技术。
音视频硬件编解码的Soc设计方案主要采用软硬件协同设计的思想,将音视频标准中的各部分分而治之:标准当中逻辑复杂但计算量小的部分采用软件实现,以增加编解码器的灵活性,同时可以进行升级;标准当中逻辑简单但计算量大计算复杂的部分以IP核的形式采用硬件实现,以增加编解码器的速度,还可以实现IP核在其他设计上的复用。从目前个人计算机上利用GPU(显卡)中硬件解码功能进行加速解码的高清视频播放的方法中就可以看到SoC设计方法的影子。个人计算机上的视频播放程序通过GPU的驱动程序,调用GPU内置的硬件解码功能实现实时加速播放,从而大大降低CPU的工作量,降低对CPU计算能力的要求。
SoC方法的设计流程如图一,通过下图可以看出,SoC设计方法中一旦软硬件功能模块划分清楚后就可以同时开发设计,大大加快设计的速度。最后软硬件协同测试完成开发。
2 基于SoC方法的AVS硬件解码器设计方案
在嵌入式设备的音视频解码方案中,硬件解码器作为一个外设模块存在,它与摄像头之类的外设处于同一级别。根据上述SoC方案的设计思想,按照AVS音视频标准P2(先进音视频编码第2部分:视频)[1]部分,对AVS视频的解码过程中计算量大计算复杂的过程分为以下几个模块:
1) 熵解码模块:熵解码是针对AVS视频编码过程采用的熵编码的反过程。熵编码采用的预计统计科学的一种编码方法,它能够有效的降低编码码长。AVS视频流中所有的码流都是经过熵编码的数据,因此熵解码的过程计算量大,计算过程也比较复杂,因此需要硬件解码来实现。
2) 帧内预测模块:AVS视频标准中,帧内预测用于解码采用帧内编码方法的帧,帧内预测是采用帧内图像的空间相关性进行编码的一种方法。帧内预测分为求参考样本、求预测模式、计算三步。预测模式又分为5种预测模式,每种预测模式是针对帧图像中的像素来计算的,而且每种预测模式的计算方法计算复杂。考虑AVS标清视频720p的每帧图像720x576的分辨率,就可以清楚的知道计算量的大小。
3) 帧间预测模块:相对于帧内预测,帧间预测是采用前后相邻帧之间的时间相关性来进行编码的,它的计算量更大,复杂性更高,这是任何一个音视频硬件解码器中必须实现的一个模块。
4) IDCT变换模块:AVS中IDCT变换,即整数离弦变换,定义如下:
先对变换系数矩阵进行如下水变换
H'= CoeffMatrix ×T8T
T8是8×8反变换矩阵,T8T是T8的转置矩阵,H'表示水变换后的中间结果,T8定义参加AVS标准。矩阵H''的元素h''ij计算如下:
h''ij = (Clip3(-215, 215-1, (h'ij+4))) >> 3 i,j = 0~7
再对矩阵H'进行如下垂直反变换:
H = T8×H''
其中,H表示反变换后的8×8矩阵。最后,残差样值矩阵ResidueMatrix的元素rij计算:
rij = (Clip3(-215, 215-1, (hij + 26))) >> 7i,j = 0~7 hij是H矩阵的元素。
对于8×8的残差样本矩阵,IDCT变换需要2次矩阵乘法,矩阵相乘需要512次乘法448次加法,总共需要1024次乘法896次加法,对于这样的计算量,显然在嵌入式设备上用软件实现是无法满足实时解码的,因此需要硬件实现。
5) 滤波模块:由于AVS编码过程中是按照8x8的模块进行预测编码的,因此在模块之间的边缘会出现变化明显的边界,因此需要对解码后的模块进行滤波。AVS解码过程滤波主要分为求边界滤波强度和计算两步,这两步的运算也是针对像素级别的运算,因此也需要大量的计算,也需要硬件来实现。
6) AVS硬件解码器的总体架构:根据以上的分析,设计出如图2的硬件解码器的方案。
SoC是一个完整的系统,因此也包含了CPU,主要用于软件部分的运行。其中程序存储模块包括程序存储器(ROM实现)和程序运行内存(RAM),通过该部分可以对硬件解码器进行升级,因此增加了解码器的灵活性。片外接口用于嵌入式系统与硬件解码器的通信,由于嵌入式的多样性,因此该模块不能通用,需要针对特定的嵌入式系统进行开发。
图2中的各个模块通过片内总线连接在一起,形成了一个完整的系统。片内总线目前主要有ARM公司开发的AMBA总线,Altera公司开发的Avalon总线以及开源的Wishbone总线,前两个总线是专有的,因此使用这个总线是需要缴纳专利费用的,而后者是开源的免费总线。具体的总线的实现可以按照不同的场合自由选择。
3 总结
本论文开展了一种面向嵌入式设备的SoC架构的AVS硬件解码器设计方案的研究。该设计方案能够有效的加快AVS解码器的设计实现,而且灵活性高,可扩展性强,IP核能够重复应用在各种不同的AVS解码器架构上,有效的利用现有资源进行开发。
参考文献
[1] 国家数字音视频解码技术标准工作组.AVS视频AVS-P2视频标准[S].
中图分类号:TN949.199文献标识码:B
The Design of a Kind of Sending Card for LED Display
DING Tie-fu1,2, YAN Fei2, WANG Rui-guang1,2, ZHENG Xi-feng1,2
(1. Changchun xida Electronic Technology Co., Ltd., Changchun Jilin 130103, China;
2. Institute of Optics, Fine Mechanics and Physics, Changchun, CAS, Changchun Jilin 130033, China)
Abstract: This article discusses a no-storage sending card for full-color LED display system. The system has real-time transmission and cost advantages. The entire real-time lossless video images, such as the formats of 1,024×768@60Hz and 1,280×1024@60Hz, can be transmitted by two-way Gigabit Ethernet port.
Keywords: full-color LED display; sending card; memory device; real-time transmission
引言
随着全彩LED显示屏的应用越来越广泛,人们对LED显示屏控制系统的要求越来越高,这也促使LED显示屏控制系统的不断升级和改造,主要体现在提高性能和节约成本上。LED显示屏控制系统的组成一般有如下几个部分[1-3]:视频发送装置、视频接收分配装置、LED面板。显然,作为前端的视频发送装置在整个环节中起着举足轻重的作用。
1LED显示屏发送卡的现状
LED显示屏发送卡一般由DVI模块、FPGA控制器、外存储体模块和网络输出模块构成[4],FPGA将输入的图像数据交替写入外存储体,同时也从外存储体中交替读出图像数据,再通过网络格式依次将数据输出,原理框图如图1所示。
通常,控制LED显示屏的计算机的分辨率设置为1,024×768@60Hz或者1,280×1,024@60Hz。对于1,280×1,024@60Hz的实时视频源,总的数据量为:
1,280×1,024×60×24=1,887,436,800 bit;
其中一帧的数据量为:1,280×1,024×24=31,457,280 bit。
考虑到分辨率为1,280×1,024@60Hz时的像素时钟为108MHz,并且整个实现过程需要2倍的存储空间进行乒乓操作,故通常采用两片32位宽的SDRAM作为外接存储体。
带有外接存储体的发送卡具有缓存一帧数据的能力,并将输出与输入隔离开,有利于从全屏的数据中按照不同需求截取所需数据进行处理。
但同时,滞后一帧数据也是实时传输中的一个缺点,尤其是在需要严格实时传输的场合。另外,增加两片SDRAM也给设计增加了成本。
2无外接存储体发送卡的实现
2.1基本框图
在现有LED显示屏发送卡的基础上,这里设计了一种无外接存储体的LED显示屏发送卡,如图2所示,该发送卡由DVI模块、FPGA控制器、两路千兆网输出模块构成。DVI解码芯片将解码得到的数据和控制信号传给FPGA控制器,FPGA通过内部的RAM进行缓存,并做了更换时钟域和位宽变换的操作,然后将处理后的数据通过千兆网输出。
对1,280×1,024@60Hz的实时视频源,这里采用垂直分区的方法,即将满屏数据平均分成两路千兆网输出,每一路千兆传输640×1,024,如图3所示。
2.2实现方法
由图2的基本框图看出,该发送卡的设计除了搭建好硬件平台外,最重要的是FPGA控制器内部程序的设计。无外接存储体发送卡的FPGA控制器内部原理框图如图4所示。
FPGA控制器的内部逻辑包括数据输入模块、双口RAM及其控制模块、24bit转8bit模块、千兆网输出模块。数据输入模块将输入的DVI信号(包括数据、时钟、使能、行场同步信号)分配给后端的RAM和RAM控制模块,并控制着整个系统的同步;RAM控制模块控制RAM的读写操作,尤其是对开始写、写停、开始读、读停这4个状态的控制;从RAM输出的数据经过并串转换后传输给千兆网输出模块,千兆网输出模块则按照一定的网络格式将接收到的数据进行打包输出[5-7]。
图3提到的将数据分区发送,该方法能够将满屏数据平均分成两路千兆网输出。以下就以垂直分区的方法分析其数据流向、时钟变化和传输时间差。
对于一路千兆网数据而言,采用1个双口RAM设计,RAM的深度设置为640,输入和输出字长均设置为24bit,读写时钟和使能分别独立,如图5所示。
其中,数据输入和写时钟分别为DVI解码芯片解码后的24bit图像数据DVI_DATA[23:0]和时钟WRAM_CLK,读RAM的时钟为千兆网时钟RMII_CLK(125M)三分频后得到的时钟RRAM_CLK(41.66MHz),这样,后端再通过一个24bit转8bit模块即可将数据进行实时传输。
如图6所示,通过RRAM_CLK(41.66MHz)时钟从RAM中读出一个像素的数据,然后再通过3个RMII_CLK(125M)传输给千兆网,即做了一个实时的并串转化。如此流水操作下去,当从RAM中读完640个像素时,千兆网控制模块将停止读RAM操作,等待下一行数据的到来。当DVI解码后的下一行数据一旦往RAM中存储的时候(至少已经往其中存储了1个像素),千兆网控制模块又开始从RAM中读取数据,如此循环,直到第1,024行数据的640个像素数据被传输完。
在这里,实时传输具有如下特点:(1)往RAM中存数据和从RAM中取数据同时进行;(2)存RAM的速度快,读RAM的速度慢;(3)对写RAM操作,先把规定的数据存完,用时为t1,然后进入等待阶段t2(t = t1 + t2为行周期);对读RAM操作,把存好数通过t3的时间传输出去,必须满足t3 < t。
标准的1,280×1,024@60Hz的行时钟为64KHz,周期为t=15.625μs;而从RAM中读完半行像素(640个)数据的时间是:t3=(1/41.66MHz)×640=15.36μs。
显然,在一个行周期里,只往外传出半行的数据,传输时间差t-t3=265ns>0,且该时间差满足千兆网传输所必需数据包间隔。
由于写RAM的时钟(108MHz)比读RAM的时钟(41.66MHz)快得多,所以在写RAM的同时可以对RAM进行读操作(至少已经往RAM存储了1个像素),边写边读,实现了视频数据的实时传输。
同理,另外一路的千兆网设计与此雷同。
3 结论
本文简单分析了LED显示屏发送卡的现状,着重讨论了无外接存储体发送卡的系统构成及实现方法。该系统具有实时传输、节约成本的优势,能够在常用的视频格式下,比如1,024×768@60Hz、1,280×1,024@60Hz,通过两路千兆网口将整个视频图像实时无损的传输出去。
参考文献:
[1] 武 斌. LED全彩屏的系统设计[D]. 硕士学位论文. 北京:北京航空航天大学,2002.
[2] 李 晟. 基于FPGA的LED显示屏同步控制系统的设计[D]. 硕士学位论文. 南京:东南大学电子工程系,2004.
[3] 蔡江洪. 全彩色LED显示屏控制系统的设计与实现[D]. 硕士学位论文. 南京:东南大学电子工程系,2005.
[4] 苏晶国. 基于FPGA的对象存储控制器原型的硬件设计与实现[D]. 中国优秀硕士学位论文全文数据库,2008(05).
[5] 柳利军,熊良芳. 基于FPGA的千兆以太网交换芯片的设计[J]. 微电子学与计算机,2006(03).
森林火灾是一种突发性强、破坏性大、救助困难的自然灾害。做好森林防火工作,有效预防和扑救森林火灾,是确保人民生命财产安全的迫切需要.当森林发生火灾时,只有做到早发现、早解决,才能把损失降到最小。针对我国森林防火的实际需要,专门设计了一整套森林防火的解决方案。
1 系统设计
系统设计图,如图1所示。
1.1 图像传输设备的选择及技术参数
模拟图像传输系统采用调频体制,信号带宽27MHz。为了保证信号之间互不干扰,两路信号中心频率间隔应大于38MHz。目前国产模拟图像传输系统主要有L波段、S波段、Ku波段几种,频率范围分别为:L波段:950~1750MHz;S波段:2200~2700MHz;Ku波段:11~13GHz。
如果以38MHz频率间隔计算,各频段可同时传输的最多路数分别为:L波段:21路;S波段:13路;Ku波段:50路。
本系统共需同时传输15路图像信号,L波段利用频率复用技术可以做到30路图像传输,从系统要求整体设备性能及造价来考虑,选择L波段。微波传输需满足视距传输条件,即监控点至控制中心传输路径上无遮挡(收发天线间可视)。
该系统方便安装,传输图像鲜明,主要是利用微波频段传输,包括报警信号、伴音和视频。
微波图像传输系统:主要技术指标:频段:L波段950~1750MHz、KU波段11~13GHz;功率:10~40dBm;
微波工程接收机技术指标:输入频率: 950-2050MHz;输入阻抗:75Ω;输入电平:-65-- -35dBm;中频带宽:27MHz;噪声门限:6dB典型值;视频制式:PAL;去加重:CCIR405-1 625行;视频输出:1V峰-峰值;频率响应:+1- -2dB(10KHz-5MHz);工作电压: AC150V-AC270V;功耗:15W;LNA电源:18V/100mA。
1.2 无线指令遥控系统
无线遥控是指实现对被控目标的非接触遥远控制,在工业控制、航空航天、家电领域应用广泛。我们设计的系统提供的数据接口,以适应各种协仪。由发射和接收部分组成,可以控制云台、镜头。
2 原理设计
如图2所示。
2.1 功能简述
在森林内多个地点放摄像机,通过无线发射C(带烟传感接收)发射各种信号,接收机能够看到森林中各个监控点的实时状况。
前端指令机能接收到监控点发出的指令,解码器来执行中心的指令,控制云平台左右上下的转动,以及对镜头进行长焦、短焦的改变等。
2.2 控制原理
2.2.1 无线图像传输的过程
无线图像传输频率复用采用分割方式,图像通道采用微波点对点的方式。摄像机通过采集的视频信号输送给发射机,然后输出给天线,以微波的无线形式传送给监控设备的天线,接收设备接收到信号了以后,再经过解调还原视频信号,这样就可以有确盘录像机中显示图像了。
在实际使用的微波通信线路中,总是使用方向性非常强的天线,并把收、发天线对准,以使接收端收到较强的直射波。但是,由于受天线的方向性所限,总会有一部分电磁波透射到地表面,经地表面反射后到达收信端的天线,或散射进入太空;其次,由于大气层中存在不均匀的气体,也会造成电磁波的折射和吸收,损失掉一部分能量;另外,由于微波无法穿过传输线路上的固体物,所以,在传输路线上的固体物,特别是高大的建筑物,就会使微波造成绕射和电平损耗。因此,微波通信既有直线传输特性,又有多径传输特性,在无遮挡的情况下,传输距离可达70公里。广泛用于公安、武警、消防、交通、金融、油田、厂矿等领域的远距离无线监控系统。
2.2.2 无线指令控制的过程
控制通道采用码分多址、一对多点方式。指令信号通过主机输入指令参数,再通过发射天线发射到森林中的各个监控点中,监控点接收到主机发射过来的信号,先通过校验,再通过无线指令接收机解调出控制数据给解码器,解码器再根据地址码来判断是否解码,同时具备双向语音功能,可以适时对话。
3 结束语
实验证明:通过采用硬盘录像系统,进行实时录象,上级领导可以通过联网的计算机进行远程监控并查询录像资料,能真实记录火灾发生及救火的过程,提供有效真实的资料,其性能可靠;高清晰、高画质,成为技术先驱。
参考文献
[1]杜建华,张认成.火灾探测器的研究现状与发展趋势[J].消防技术,2004(07):10-15.
[2]徐春燕.火灾探测技术的发展及其应用[J].鞍钢技术,2000(09):60-62.
[3]花铁森.消防报警产品和系统的技术现状与市场[J].安防科技,2003(06):4-12.
[4]祁勇.火灾自动探测技术的发展和今后的方向[J].消防技术与产品信息,2002(04):3-4.
[5]谢磊.基于ZigBee的仓库数据采集传输管理系统研究[D].西安:西安工业大学[硕士学位论文],2011.
[6]李志华.基于无线传感器网络的火灾预警系统设计[D].汕头:汕头大学[硕士学位论文],2009.
[7]颜学义.基于ZigBee的智能火灾报警系统[D].长沙:国防科学技术大学[硕士学位论文],2008.
[8]吴起,蒋军成.基于BP神经网络技术的实验数据分析处理[J].中国安全科学报,2006,16(01):39-43.
[9]田亚.基于ZigBee无线传感器网络系统设计和实现[D].上海:同济大学[硕士学位论文],2007.
作者简介
壹、前言
由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。
贰、WAVELET的历史起源
WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、WAVELET影像压缩简介及基础理论介绍
一、WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。
WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。
二、影像压缩过程
原始图形资料色彩模式转换&n
bsp;DCT转换量化器编码器编码结束
三、编码的基本要素有三点
(一)一种压缩/还原的转换可表现在影像上的。
(二)其转换的系数是可以量化的。
(三)其量化的系数是可以用函数编码的。
四、现有WAVELET影像压缩工具主要的部份
(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。
(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种为内插。
(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffat''''slineartimecodinghistogram的基础上。
(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、WAVELET影像压缩未来的发展趋势
一、在其结构上加强完备性。
二、修改程式,使其可以处理不同模式比率的影像。
三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、加强运算的能力,使其可支援更多的影像格式。
五、使用WAVELET转换藉由消除高频率资料增加速率。
六、增加多种的WAVELET。如:离散、零元树等。
七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、增加8X8格的DCT模式,使其能做JPEG的压缩。
九、增加8X8格的DCT模式,使其能重叠。
十、增加trelliscoding。
十一、增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、影像压缩研究的方向
1.输入装置如何捕捉真实的影像而将其数位化。
2.如何将数位化的影像资料转换成利於编码的资料型态。
3.如何控制解码影像的品质。
4.如何选择适当的编码法。
5.人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。
图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献:
1.Geoff&nb
sp;Davis,1997,WaveletImageCompressionConstructionKit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。
5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。
6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。
7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。
附录:
嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送
目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。
阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(LowpassSubband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。
基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet,简称LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。
LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。
壹、前言
由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。
贰、WAVELET的历史起源
WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、WAVELET影像压缩简介及基础理论介绍
一、WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。
WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。
二、影像压缩过程
原始图形资料色彩模式转换&n
bsp;DCT转换量化器编码器编码结束
三、编码的基本要素有三点
(一)一种压缩/还原的转换可表现在影像上的。
(二)其转换的系数是可以量化的。
(三)其量化的系数是可以用函数编码的。
四、现有WAVELET影像压缩工具主要的部份
(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。
(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种为内插。
(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffat''''slineartimecodinghistogram的基础上。
(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、WAVELET影像压缩未来的发展趋势
一、在其结构上加强完备性。
二、修改程式,使其可以处理不同模式比率的影像。
三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、加强运算的能力,使其可支援更多的影像格式。
五、使用WAVELET转换藉由消除高频率资料增加速率。
六、增加多种的WAVELET。如:离散、零元树等。
七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、增加8X8格的DCT模式,使其能做JPEG的压缩。
九、增加8X8格的DCT模式,使其能重叠。
十、增加trelliscoding。
十一、增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、影像压缩研究的方向
1.输入装置如何捕捉真实的影像而将其数位化。
2.如何将数位化的影像资料转换成利於编码的资料型态。
3.如何控制解码影像的品质。
4.如何选择适当的编码法。
5.人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。
图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献:
1.Geoff&nb
sp;Davis,1997,WaveletImageCompressionConstructionKit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。
5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。
6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。
7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。
附录:
嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送
目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。
阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(LowpassSubband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。
基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet,简称LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。
LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。
引言
智能家居控制系统以家居电器及家电设备为主要控制对象,利用综合布线技术、网络通信技术、安全防范技术、自动控制技术、音视频技术将家居生活有关的设施进行高效集成,构建高效的住宅设施与家庭日程事务的控制管理系统,提升家居智能、安全、便利、舒适,并实现环保控制系统平台。其中家居电器控制采用弱电控制强电方式,既安全又智能,可以用遥控、定时等多种智能控制方式实现对在家里饮水机、插座、空调、地暖、投影机、音像设备以及新风系统等进行智能控制,用以避免饮水机在夜晚反复加热影响水质,在外出时断开插排通电,避免电器发热引发安全隐患等等。本系统设计正是在这样的背景下产生,并以家居音频设备为控制对象。整个系统的设计是通过随身携带的智能手机利用无线网络和家庭无线路由对嵌入式ARM为核心的音乐播放器进行远程操控。下文是对整个系统的设计原理和设计过程的详细论述。
一、总体方案设计
整个系统由智能手机、路由器、开发板三个部分组成。智能手机通过连接无线信号实现与开发板的通信,这里由于所使用的mini2440开发板缺少无线网卡的支持,所以路由器充当了无线网卡的作用,负责发射无线信号:
1.1 硬件方案
硬件平台选用友善之臂提供的mini2440开发板,处理器采用基于ARM9内核的Samsung S3C2440。由于S3C2440内部配有64M SDRAM,256M NandFlash,所以完全可以胜任内部的音频解码任务。另外,为了保证系统运行时的稳定性,采用了专业的CPU内核电源芯片和复位芯片。相对来说,手机的选择比较自由,只要是安卓系统的智能手机都可以,在APP测试时,要求手机的安卓操作系统是Android2.3版本或以上。
1.2软件方案
要将硬件设备连接并且工作,关键是软件的开发,因此软件开发环境的选择很重要。整个系统的软件开发主要包括操作系统的裁剪和移植、音频播放程序的开发、Android应用的开发三个部分。音频解码采用软件解码。主要是利用CPU进行音频数据的解码,这需要在Linux操作系统下移植一个开源音频解码库--madplay。采用软件解码虽然增加了CPU的开销,但大大缩短了开发时间,而且不需要考虑解码芯片的选择和驱动问题。
智能手机选用了安卓的操作系统,主要考虑到安卓系统是一种基于Linux的自由及开放源代码的操作系统,且市场占有量较高,2011年第一季度,Android在全球的市场份额首次超过塞班系统,跃居全球第一。 2013年的第四季度,Android平台手机的全球市场份额已经达到78.1%,全世界采用这款系统的设备数量已经达到10亿台,2014年第一季度Android平台已占所有移动广告流量来源的42.8%,首度超越iOS(运营收入不及iOS)。
二、软件开发
2.1 操作系统裁剪
操作系统的裁剪是系统设计的重点,一个精简的操作系统不仅可以加快系统的开机时间,还能减小CPU的开销,使系统运行的更加流畅。操作系统由uboot、内核、文件系统组成,需要裁剪的部分包括内核(去掉不必要的配置)以及文件系统
2.2 音频解码数据库的移植
madplay是linux下的开源音乐播放器,利用开源解码库libmad实现音频的编解码,目前该播放器除了不支持网络歌曲的播放外,其余功能都支持,如快进、暂停、继续等。开发人员需要自己开发一个自己的可视化界面或者播放器的管理程序,这样使用起来才方便、快捷。系统设计时需要在开发板的ARM内核上运行madplay可执行文件,所以移植madplay也是本次设计的重要环节。
2.3 音乐播放器设计
播放器的核心代码就是音乐的播放程序,在整个行程序运行时的内部主控流程:
父进程负责接收按键信息或者socket信息。监听部分由select()函数完成,当按键或者socket文件描述符发生变化的时候,父进程首先判断按键或者socket信息,根据不同的信息向子进程或者孙进程发送不同的信号。如,父进程收到的按键信息是“暂停”,调用kill()函数向子进程和孙进程发送SIGSTOP信号就可以暂停音乐的播放。
2.4 Android应用程序设计
Android操作系统下设计控制软件可简可繁,这里的界面的设计由于缺少专业UI的支持,所以设计的比较简单。用到的控件主要有Button、TextView、ScrollView、ListView、TabHost,其中前面4个采用常规控制,调用简单,只需在activity_main.xml文件中调用并设置相应的属性(如长、宽、在页面中的位置等)即可。TabHost用起来有点麻烦,这里需要注意两点:
在开发自己的app过程中,主要难点在于新的线程接收服务器返回的信息,其主要的代码如下:
Android部分的设计逻辑明了,算法简单。作为客户端或者命令发送端,只需向服务器发送自己的指令即可。
三、性能测试
系统的运行需要开发板、路由器以及APP三者的配合,路由器和开发板之间通过网线连接。需要设置路由器和开发板在同一个网段。测试中,路由器IP为192.168.1.10,开发板IP为192.168.1.22。经测试,播放器可以通过按键或者APP实现歌曲切换、音量调节、歌曲信息显示、播放模式的切换。并且经过裁剪的操作系统启动速度快,从系统上电到程序运行仅需要20秒。
本系统设计关键在于操作系统的裁剪移植以及加入了手机APP的控制。省去了QT以及内核中不必要的模块,使播放器的开机速度更加快,同时也减小了CPU的资源消耗;加入手机APP的控制,符合目前智能家居的发展趋势,使得播放器使用起来更加的方便、人性化。
系统还存在一个问题未能很好解决。歌曲播放完毕并且切换到下一首后,手机APP测并不能实现播放曲目的更新。
目前,APP上显示的歌曲信息只有三种情况会更新:点击上一首或者下一首、暂停后继续、点击开始播放。试着修改代码,子进程在实现共享内存更新后将歌曲信息发送给APP,但是问题来了,APP和开发板的通信是基于UDP协议,即无连接,通俗的说,每次通信过程,只有当APP发送数据给开发板,开发板收到数据后同时记下了客户端(APP)地址信息,通过地址信息将数据返回给APP。所以如果系统上电后APP并未接入网络,开发板发送数据时将会报错。感兴趣的读者可以在APP发送数据给开发板后设定一个标志位,然后根据这个标志位判断播放下一首歌曲的时候是否要将歌曲信息发送给APP。
参 考 文 献
[1] Matt Welsh & Lar Kaufman,linux权威指南[M] 中国电力出版社 2000 年3月
壹、前言
由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有True Color的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480 True Color图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。
贰、 WAVELET的历史起源
WAVELET源起於Joseph Fourier的热力学公式。傅利叶方程式在十九世纪初期由Joseph Fourier (1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J. Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系 { a -1/2 Ψ[(x-b)/a] ;a,b?R ,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y. Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系 {Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(Compactly Supported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、 WAVELET影像压缩简介及基础理论介绍
一、 WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramid coding)、滤波器组理论(filter bank theory)、以及次旁带编码(subband coding),可以说wavelet transform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。
WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。 将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。
二、 影像压缩过程
原始图形资料 色彩模式转换 DCT转换 量化器 编码器 编码结束
三、 编码的基本要素有三点
(一) 一种压缩/还原的转换可表现在影像上的。
(二) 其转换的系数是可以量化的。
(三) 其量化的系数是可以用函数编码的。
四、 现有WAVELET影像压缩工具主要的部份
(一) Wavelet Transform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二) Filters(滤镜):这部份包含Wavelet Transform,和一些着名的压缩方法。
(三) Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四) Entropy Coding(熵编码器):有两种格式,一种是使其减少,一种为内插。
(五) Arithmetic Coder(数学公式):这是建立在Alistair Moffat's linear time coding histogram的基础上。
(六) Bit Allocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、 WAVELET影像压缩未来的发展趋势
一、 在其结构上加强完备性。
二、 修改程式,使其可以处理不同模式比率的影像。
三、 支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、 加强运算的能力,使其可支援更多的影像格式。
五、 使用WAVELET转换藉由消除高频率资料增加速率。
六、 增加多种的WAVELET。如:离散、零元树等。
七、 修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、 增加8X8格的DCT模式,使其能做JPEG的压缩。
九、 增加8X8格的DCT模式,使其能重叠。
十、 增加trellis coding。
十一、 增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、 影像压缩研究的方向
1. 输入装置如何捕捉真实的影像而将其数位化。
2. 如何将数位化的影像资料转换成利於编码的资料型态。
3. 如何控制解码影像的品质。
4. 如何选择适当的编码法。
5. 人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、 在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。
图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、 结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献
1.Geoff Davis,1997,Wavelet Image Compression Construction Kit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上), 峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下), 峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。