首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

从 POWER5 升级到 POWER6-3

从 POWER5 升级到 POWER6-3

引导每个 VIOS下一步是引导 VIOS。我启动一个 VIOS,等待它开始引导。这花费了很长时间,因为我给这个 VIOS 分配了许多磁盘(超过 100 个),而且有四条到 SAN 的路径,这些都必须扫描。几分钟之后,我进入了 SMS 菜单,确认了引导列表包含这个 VIOS 的 rootvg 磁盘(把我的文档放在手边,可以非常方便地检查)。这里需要非常小心。
我注意到,识别出了几个安装了 AIX 的磁盘,但是它们不属于我的 VIOS rootvg!这些是属于客户机 LPAR 的 rootvg 磁盘。如果我选择了错误的磁盘,就会引导了错误的系统。因此,在升级之前收集 VIOS rootvg 磁盘的位置码是很重要的。
我退出 SMS 菜单,让 VIOS 以正常方式引导。系统正常启动,没有遇到错误。我使用控制台作为 padmin 登录,运行 lsmap –alcl 和 lsmap –all –net。所有虚拟适配器映射和 SEA 都是可用的。我发现的惟一变化是,vhost 的位置码有变化,其中的 595 变成了 FHA(如下所示);但是,槽号和序列号是相同的。
1
2
3
< vhost0          U9119.595.8369B40-V2-C20                     0x00000000
---
> vhost0          U9119.FHA.8369B40-V2-C20                     0x00000000




我注意到,每个 VIOS 上的引导列表改变了。列表中只有 hdisk0 和第一个网络适配器 (ent0)。VIOS 上的 root 卷组是镜像的,所以需要修改引导列表,包含 rootvg 中的可引导磁盘:# bootlist –m normal hdisk0 hdisk8。这是正常的,因为 NVRAM(其中包含引导列表)没有从老的 p5 转移到新的 p6。
VIOS 健康状态检查在启动 LPAR 之前,先在每个 VIOS 上执行几个健康状态检查。健康状态检查见表 1。这些步骤检查 VIOS 的健康状态。我寻找任何异常情况,比如处于 Defined 状态的设备或错误日志中持久的硬件错误。
表 1. VIOS 健康状态检查表
VIOS 检查

描述lsconf确认处理器显示 POWER6ioslevel检查 VIOS 级别cfgdev检查任何缺失的设备文件集lsmap –all检查 VTD 映射lsmap –all -net检查 SEA 配置lsdev -virtual检查虚拟设备是 Availablelsdev –type disk检查磁盘设备是 Availablelsdev –type adapter检查适配器是 Availableentstat -all检查 SEA 状态和优先级errlog检查错误日志中的严重错误lsdev –dev fscsiX –attr检查设备属性lsdev –dev hdiskX -attr检查磁盘设备属性lspv检查磁盘 pvidpcmpath query adapter检查 SDDPCM 适配器状态pcmpath query device检查 SDDPCM 磁盘设备状态和 LUNIDpcmpath query wwpn检查 SDDPCM 已知的 FC 适配器 WWPNpcmpath query version检查 SDDPCM 级别lspath检查是否启用了所有磁盘路径netstat -nr检查默认网关
引导 LPAR在启动 VIOS 并检查虚拟适配器映射和健康状态之后,我启动一个 AIX LPAR。我引导这个 LPAR,进入 SMS,查看引导列表,检查列表中是否包含正确的 rootvg 磁盘。没问题。以正常方式引导 LPAR。
AIX 健康状态检查我在每个 AIX LPAR 上执行几个健康状态检查。同样,我检查操作系统是否运行正常。健康状态检查见表 2。升级之后需要做的惟一修改是,用镜像的 rootvg 重新设置 LPAR 的引导列表(就像在 VIOS 上所做的):# bootlist -m normal hdisk0 blv=bos_hd5 hdisk1 blv=bos_hd5。如果在 AIX 系统上使用 multibos,执行这个操作时就要特别小心,因为可能有两个引导逻辑卷 (BLV)。必须选择正确的磁盘分区(例如下面所示的 part=2 或 part=4);否则,就会引导 AIX 系统的老映像。
1
2
3
4
5
6
7
8
9
10
11
PowerPC Firmware
Version EH340_039
SMS 1.7 (c) Copyright IBM Corp. 2000,2008 All rights reserved.
------------------------------------------------------------------------
Select Device
Device  Current  Device
Number  Position  Name
1.        -      SCSI 136 GB Harddisk, part=2 (AIX 5.3.0)
        ( loc=U9119.FHA.8369B40-V22-C46-T1-L8100000000000000 )
2.        -      SCSI 136 GB Harddisk, part=4 (AIX 5.3.0)
        ( loc=U9119.FHA.8369B40-V22-C46-T1-L8100000000000000 )




我建议在升级之前删除 multibos 实例 (multibos –R),以避免混淆。
表 2. AIX 健康状态检查表
AIX 检查

描述lsconf确认处理器显示 POWER6cfgmgr检查任何缺失的设备文件集1
2
3
lsdev –C | grep Defined
lsdev –Cc adapter
lsdev –Cc disk




检查设备是否处于正确的状态lparstat –i检查 LPAR 配置oslevel –s检查 AIX SP 级别oslevel –r检查 AIX TLbootlist –m normal -o
1
2
3
4
5
6
7
8
9
10
11
12
13
检查引导列表设置

预期的输出如下:

- 对于镜像的 rootvg(包括 VIOS):
# bootlist -m normal -o
hdisk0 blv=bos_hd5
hdisk4 blv=bos_hd5

- 对于 SAN 引导 rootvg:
# bootlist -m normal -o
hdisk0 blv=bos_hd5
hdisk0 blv=bos_hd5




1
2
3
4
instfix –i |grep AIX
instfix –i |grep SP
instfix –icqk 53-07-050831_SP | grep “:-:”
instfix –icqk 5300-07_AIX_ML |grep “:-:”




检查任何缺失的 AIX TL 或 SP 文件集lsvg –l rootvg |grep stale检查 rootvg 中的 ‘stale’ 分区
1
2
3
df
mount
lsvg | lsvg –il | grep close




检查是否挂载了所有必需的文件系统df /var检查 /var 是否满了df /tmp检查 /tmp 是否满了sysdumpdev –l检查系统转储配置是否正确lsattr –El mem0检查内存配置是否正确emgr –l检查 ‘efix’ 清单(如果有的话)lppchk –v –m3检查安装的文件集lppchk –c –m3对安装的文件集进行校验和检查lsps –a检查分页空间smtctl检查 smt 是否可以打开/关闭所有节点lssrc –ls xntpd | grep “Reference Id”检查节点上的 ntpvmo –a检查所有 vmo 设置no –a检查所有网络选项设置netstat –nr检查路由表lspath检查是否启用了所有路径errpt检查任何持久的硬件错误或其他严重错误tail -100 /var/log/syslog检查任何严重的错误alog –of /var/adm/ras/conslog检查控制台日志中的错误
1
2
cat /etc/qconfig
lpstat




检查是否定义并启用了打印队列lssrc –a检查 activeinoperative 文件系统
1
2
pstat –a | grep aio
lsattr –El aio0




检查是否配置了 AIOlsattr -El sys0 -a minpout -a maxpout检查 I/O pacing 设置date检查日期和时间是否正确
1
2
echo $TZ
grep TZ /etc/environment




检查 TZ 变量的设置是否合适lsattr –El hdiskX –a queue_depth检查所有 hdisk 上的队列深度topas –C从一个 VIOS 运行 ‘topas –C’。检查所有 LPAR 是否能够报告性能数据
通过使用 lsconf 命令,可以快速地确认 LPAR 现在已经在新的 POWER6 平台上运行了。下面是升级之前和之后一个 LPAR 的输出。“System Model” 已经由 9119-595 变成了 9119-FHA,处理器类型和速度也改变了。
返回列表