首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

Embedded linux 的学习框架

Embedded linux 的学习框架

作为一名刚接触嵌入式开发的新手,网络上浩如烟海的embedded linux技术资料,大
量可用的引导装载程序(bootloader)、分发版(distribution)、文件系统和 GUI 等
等让人看起来如坠云雾,令很多有志于学习embedded技术的朋友望而生畏,无从下手。


   本人就曾经迷茫过好久,到底怎样规划自己的研究框架呢?到底embedded linux有哪
些东西必须掌握呢?到底怎样才能走向高手之路呢?太多的疑惑和不解--所以想我结合自
己学习过程中的一些粗浅体会,总结一点研究和学习的思路和框架,给感兴趣的朋友们
,当你们开始这段艰难之旅的时候,至少有个比较清晰的前进方向,如果确实能对大家
提供一点微不足道的帮助,那么就是我莫大的安慰了。


   需要说明的一点是,本人功力尚浅,初窥门径而已,尚未登堂入室,此番不揣冒昧,
勉强为之,实身为斑竹,责无旁贷也。巍巍水源,藏龙卧虎,高手如云,若区区文章有何
纰漏不足之处,亦或大家有好的建议和想法,无妨直言之,繁荣版面,义不容辞。如果
我抛出的这些破砖,能引来众多美玉,则吾道不孤也,焉不幸甚至哉!

51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
Linux 正在嵌入式开发领域稳步发展,任何感兴趣的人都可以从因特网免费下载其内
核和应用程序,并开始移植或开发。许多 Linux 改良品种迎合了嵌入式/实时市场。常
用的主要包括RTLinux(实时 Linux)、uclinux(用于非 MMU 设备的 Linux)、ARM-Li
nux(ARM 上的 Linux)和其它 Linux 系统。 年初刚发行的linux kernel 2.6更是把uc
linux吸收进主流内核了, Embedded Linux发展的影响由此可见一斑。
Embedded Linux 开发大致涉及四个层次:引导装载程序、Linux 内核,图形用户界面
(或称 GUI)和应用程序(这个依赖于具体应用,没什么好说的)。内核中我主要谈谈
设备驱动程序和文件系统。所以后续内容我准备就大致分为以下几部分来讨论:

一 引导装载程序(bootloader);

二 设备驱动程序;

三 嵌入式设备常用文件系统;

四 图形用户界面(GUI)。

在每个部分中,我将对我认为必须掌握或者说比较重要的内容做一个概述,给出主要
的学习框架,至于更具体的工作,还有待各位感兴趣的朋友自己去深入学习和钻研。
51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
为什么需要引导加载程序Boot Loader呢?
引导加载程序是系统加电后运行的第一段软件代码。回忆一下 PC 的体系结构我们可
以知道,PC 机中的引导加载程序由 BIOS(其本质就是一段固件程序)和位于硬盘 MBR
中的OS Boot Loader(比如,LILO 和 GRUB 等)一起组成。BIOS 在完成硬件检测和
资源分配后,将硬盘 MBR 中的 Boot Loader 读到系统的 RAM 中,然后将控制权交给 OS
Boot Loader。Boot Loader 的主要运行任务就是将内核映象从硬盘上读到 RAM 中,然
后跳转到内核的入口点去运行,也即开始启动操作系统。
而在嵌入式系统中,通常并没有像 BIOS 那样的固件程序(有的嵌入式 CPU 也会内嵌
一段短小的启动程序),因此整个系统的加载启动任务就完全由 Boot Loader 来完成。比
如在一个基于 ARM7TDMI core 的嵌入式系统中,系统在上电或复位时通常都从地址
0x00000000 处开始执行,而在这个地址处安排的通常就是系统的 Boot Loader 程序。
简单地说,Boot Loader 就是在操作系统内核运行之前运行的一段小程序。通过这段
程序,我们可以初始化硬件设备、建立内存空间的映射图,从而将系统的软硬件环境带
到一个合适的状态,以便为最终调用操作系统内核准备好正确的环境。 通常在嵌入式系
统里,Boot Loader 是严重地依赖于硬件而实现的。所以不要指望有一个通用的 Boot
Loader,然后一劳永逸。每种不同的 CPU 体系结构都有不同的 Boot Loader,也有些
Boot Loader支持多种体系结构的 CPU。对于两块不同的嵌入式板,即使CPU相同,但是
由于板级配置不同,仍然需要修改 Boot Loader 的源程序。总之,我们需要学习Boot
Loader,至少要知道怎么修改它来满足你开发的需要。现在购买开发板的时候,一般公
司会提供一个可用的Boot Loader给你,那么恭喜你,你又有一个研究源代码的机会了,
呵呵。
下一节讲讲Boot Loader的主要任务和框架。由于芯片内执行(XIP, eXecute In
Place)技术的存在,程序可以直接在flash闪存内运行,不必再把代码读到系统RAM中
,因此嵌入式系统中内核映像与根文件系统映像可以直接在Flash 这样的固态存储设备
中(主要指NOR flash)直接运行,虽然速度会慢点。所以首先声明一下,我们假定内河
映像与根文件系统映像都被加载到 RAM来执行这样一种情况。
51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
从操作系统的角度看,Boot Loader 的总目标就是正确地调用内核来执行。 另外,
由于 Boot Loader 的实现依赖于 CPU 的体系结构,因此大多数 Boot Loader 都分为
stage1 和 stage2 两大部分。依赖于 CPU 体系结构的代码,比如设备初始化代码等,
通常都放在 stage1 中,而且通常都用汇编语言来实现,以达到短小精悍的目的。而
stage2 则通常用C语言来实现,这样可以实现给复杂的功能,而且代码会具有更好的可
读性和可移植性。 Boot Loader 的 stage1 通常包括以下步骤(以执行的先后顺序):

1. stage 1

1.1 硬件设备初始化。
这是 Boot Loader 一开始就执行的操作,其目的是为 stage2 的执行以及随后的
kernel 的执行准备好一些基本的硬件环境。它通常包括以下步骤(以执行的先后顺序)
:屏蔽所有的中断; 设置 CPU 的速度和时钟频率; RAM 初始化; 初始化 LED; 关闭
CPU 内部指令/数据 cache
1.2 为加载 Boot Loader 的 stage2 准备 RAM 空间。
为了获得更快的执行速度,通常把 stage2 加载到 RAM 空间中来执行,因此必须为
加载 Boot Loader 的 stage2 准备好一段可用的 RAM 空间范围。
由于 stage2 通常是 C 语言执行代码,因此在考虑空间大小时,除了 stage2 可执
行映象的大小外,还必须把堆栈空间也考虑进来。此外,空间大小最好是 memory
page 大小(通常是 4KB)的倍数。一般而言,1M 的 RAM 空间已经足够了。另外,还必须
确保所安排的地址范围的的确确是可读写的 RAM 空间,因此,必须对你所安排的地址范
围进行测试。具体的测试方法可以采用类似于 blob 的方法,也即:以 memory page 为
被测试单位,测试每个 memory page 开始的两个字是否是可读写的。
1.3 拷贝 Boot Loader 的 stage2 到 RAM 空间中。
拷贝时要确定两点:(1) stage2 的可执行映象在固态存储设备的存放起始地址和终
止地址;(2) RAM 空间的起始地址。
1.4 设置好堆栈。
堆栈指针的设置是为了执行 C 语言代码作好准备。通常我们可以把 sp 的值设置为
(stage2_end-4),也即在RAM 空间的最顶端(堆栈向下生长)
1.5 跳转到 stage2 的 C 入口点。
在上述一切都就绪后,就可以跳转到 Boot Loader 的 stage2 去执行了。比如,在
ARM 系统中,这可以通过修改 PC 寄存器为合适的地址来实现。

51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
正如前面所说,stage2 的代码通常用 C 语言来实现,以便于实现更复杂的功能和
取得更好的代码可读性和可移植性。但是与普通 C 语言应用程序不同的是,在编译和链
接 boot loader 这样的程序时,我们不能使用 glibc 库中的任何支持函数。其原因是
显而易见的。这就给我们带来一个问题,那就是从那里跳转进 main() 函数呢?直接把
main() 函数的起始地址作为整个 stage2 执行映像的入口点或许是最直接的想法。但是
这样做有两个缺点:1)无法通过main() 函数传递函数参数;2)无法处理 main() 函数返
回的情况。一种更为巧妙的方法是利用 trampoline(弹簧床)的概念。也即,用汇编语言
写一段trampoline 小程序,并将这段 trampoline 小程序来作为 stage2 可执行映象的
执行入口点。然后我们可以在 trampoline 汇编小程序中用 CPU 跳转指令跳入
main() 函数中去执行;而当 main() 函数返回时,CPU 执行路径显然再次回到我们的
trampoline 程序。简而言之,这种方法的思想就是:用这段 trampoline 小程序来作为
main() 函数的外部包裹(external wrapper)。
2.1 初始化本阶段要使用到的硬件设备。
这通常包括:(1)初始化至少一个串口,以便和终端用户进行 I/O 输出信息;(2
)初始化计时器等。 设备初始化完成后,可以输出一些打印信息,程序名字字符串、版本号
等。
2.2 检测系统内存映射(memory map)。
所谓内存映射就是指在整个 4GB 物理地址空间中有哪些地址范围被分配用来寻址系
统的 RAM 单元。具体的嵌入式系统往往只把 CPU 预留的全部 RAM 地址空间中的一部分映射
到 RAM 单元上,而让剩下的那部分预留 RAM 地址空间处于未使用状态。由于上述这个
事实,因此 Boot Loader 的 stage2 必须在它想干点什么 (比如,将存储在 flash 上
的内核映像读到 RAM 空间中) 之前检测整个系统的内存映射情况,也即它必须知道
CPU 预留的全部 RAM 地址空间中的哪些被真正映射到 RAM 地址单元,哪些是处于
"unused" 状态的。
2.3 将 kernel 映像和根文件系统映像从 flash 上读到 RAM 空间中。
对于内核映像,一般将其拷贝到从(MEM_START+0x8000) 这个基地址开始的大约1MB
大小的内存范围内(嵌入式 Linux 的内核一般都不操过 1MB)。为什么要把从 MEM_START
到 MEM_START+0x8000 这段 32KB 大小的内存空出来呢?这是因为 Linux 内核要在这段内
存中放置一些全局数据结构,如:启动参数和内核页表等信息。而对于根文件系统映像
,则一般将其拷贝到 MEM_START+0x0010,0000 开始的地方。如果用 Ramdisk 作为根文
件系统映像,则其解压后的大小一般是1MB。
由于像 ARM 这样的嵌入式 CPU 通常都是在统一的内存地址空间中寻址 Flash 等固态存
储设备的,因此从 Flash 上读取数据与从 RAM 单元中读取数据并没有什么不同。用一
个简单的循环就可以完成从 Flash 设备上拷贝映像的工作。
2.4 为内核设置启动参数。
应该说,在将内核映像和根文件系统映像拷贝到 RAM 空间中后,就可以准备启动
Linux 内核了。但是在调用内核之前,应该作一步准备工作,即:设置 Linux 内核的启
动参数。Linux 2.4.x 以后的内核都期望以标记列表(tagged list)的形式来传递启动参
数。启动参数标记列表以标记 ATAG_CORE 开始,以标记 ATAG_NONE 结束。每个标记由
标识被传递参数的 tag_header 结构以及随后的参数值数据结构来组成。
Linux 内核在启动时可以以命令行参数的形式来接收信息,利用这一点我们可以向
内核提供那些内核不能自己检测的硬件参数信息,或者重载(override)内核自己检测到
的信息。
2.5 调用内核
Boot Loader 调用 Linux 内核的方法是直接跳转到内核的第一条指令处,也即直接跳转
到 MEM_START+0x8000 地址处。在跳转时,下列条件要满足:
1. CPU 寄存器的设置:
R0=0;
R1=机器类型 ID;关于 Machine Type Number,可以参见
linux/arch/arm/tools/mach-types。
R2=启动参数标记列表在 RAM 中起始基地址;
2. CPU 模式:
必须禁止中断(IRQs和FIQs);
CPU 必须 SVC 模式;
3. Cache 和 MMU 的设置:
MMU 必须关闭;
指令 Cache 可以打开也可以关闭;
数据 Cache 必须关闭;
51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
关于串口调试终端

在 boot loader 程序的设计与实现中,没有什么能够比从串口终端正确地收到打印
信息能更令人激动了。此外,向串口终端打印信息也是一个非常重要而又有效的调试手
段。但是,我们经常会碰到串口终端显示乱码或根本没有显示的问题。造成这个问题主
要有两种原因:(1) boot loader 对串口的初始化设置不正确。(2) 运行在 host 端的
终端仿真程序对串口的设置不正确,这包括:波特率、奇偶校验、数据位和停止位等方
面的设置。
此外,有时也会碰到这样的问题,那就是:在 boot loader 的运行过程中我们可以
正确地向串口终端输出信息,但当 boot loader 启动内核后却无法看到内核的启动输出
信息。对这一问题的原因可以从以下几个方面来考虑:
(1) 首先请确认你的内核在编译时配置了对串口终端的支持,并配置了正确的串口驱动
程序。
(2) 你的 boot loader 对串口的初始化设置可能会和内核对串口的初始化设置不一致。
此外,对于诸如 s3c44b0x 这样的 CPU,CPU 时钟频率的设置也会影响串口,因此如果
boot loader 和内核对其 CPU 时钟频率的设置不一致,也会使串口终端无法正确显示信
息。
(3) 最后,还要确认 boot loader 所用的内核基地址必须和内核映像在编译时所用的运
行基地址一致,尤其是对于 uClinux 而言。假设你的内核映像在编译时用的基地址是
0xc0008000,但你的 boot loader 却将它加载到 0xc0010000 处去执行,那么内核映像
当然不能正确地执行了。

结束语

Boot Loader 的设计与实现是一个非常复杂的过程。如果不能从串口收到那激动人心
的"uncompressing linux.................. done, booting the kernel……"内核启动信
息,鬼才知道你的 boot loader 已经成功地转起来了,哈哈~~~~






为什么Embedded linux 下一般不用 Ext2fs ?

Ext2fs 是 Linux 事实上的标准文件系统。因为 Ext2 文件系统的稳定性、可靠性
和健壮性,所以几乎在所有基于 Linux 的系统(包括台式机、服务器和工作站 - 并且
甚至一些嵌入式设备)上都使用 Ext2 文件系统。当在嵌入式设备中使用 Ext2fs 时,
它有一些缺点:

1. Ext2fs 是为象 IDE 设备那样的块设备设计的,这些设备的逻辑块大小是 512 字
节,1 K 字节等这样的倍数。这不太适合于扇区大小因设备不同而不同的闪存设备。

2. Ext2 文件系统没有提供对基于扇区的擦除/写操作的良好管理。在 Ext2fs 中,
为了在一个扇区中擦除单个字节,必须将整个扇区复制到 RAM,然后擦除,然后重写入。
考虑到闪存设备具有有限的擦除寿命(大约能进行 100,000 次擦除),在此之后就不能
使用它们,所以这不是一个特别好的方法。

3. 在出现电源故障时,Ext2fs 不是防崩溃的。这个很多情况下这是不采用Ext2fs的
关键性因素。

4. Ext2 文件系统不支持损耗平衡,因此缩短了扇区/闪存的寿命。(损耗平衡确保
将地址范围的不同区域轮流用于写和/或擦除操作以延长闪存设备的寿命。)

5. Ext2fs 没有特别完美的扇区管理,这使设计块驱动程序十分困难。
51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
返回列表