機器管理 #3
完了PC F2AM85-V
高橋 徹 さんが約11年前に更新
elrepoより、kmod-alx-0.0-8.el6.elrepo.x86_64.rpm を入手してアップデートインストールし、再起動したところ、
なかなか起動しなかった。コンソールを見ると、次のエラーが繰り返し出ていた。
Feb 20 21:09:10 bouchard kernel: ata2.00: irq_stat 0x40000008 Feb 20 21:09:10 bouchard kernel: ata2.00: failed command: READ FPDMA QUEUED Feb 20 21:09:10 bouchard kernel: ata2.00: cmd 60/08:00:10:08:00/00:00:00:00:00/40 tag 0 ncq 4096 in Feb 20 21:09:10 bouchard kernel: res 41/40:00:10:08:00/00:00:00:00:00/40 Emask 0x409 (media error) <F> Feb 20 21:09:10 bouchard kernel: ata2.00: status: { DRDY ERR } Feb 20 21:09:10 bouchard kernel: ata2.00: error: { UNC } Feb 20 21:09:10 bouchard kernel: ata2.00: configured for UDMA/133 Feb 20 21:09:10 bouchard kernel: ata2: EH complete Feb 20 21:09:10 bouchard kernel: ata2.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
そして、次のエラーメッセージも気になる
Feb 20 21:09:10 bouchard kernel: sd 1:0:0:0: [sda] Unhandled sense code Feb 20 21:09:10 bouchard kernel: sd 1:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE Feb 20 21:09:10 bouchard kernel: sd 1:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor] Feb 20 21:09:10 bouchard kernel: Descriptor sense data with sense descriptors (in hex): Feb 20 21:09:10 bouchard kernel: 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 Feb 20 21:09:10 bouchard kernel: 00 00 08 10 Feb 20 21:09:10 bouchard kernel: sd 1:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed Feb 20 21:09:10 bouchard kernel: Buffer I/O error on device sda1, logical block 2
エラーメッセージでぐぐると、こんなページが見つかる。HDDが故障間近で危険状態らしい。
http://kledgeb.blogspot.jp/2013/07/ubuntu-6-hdd.html
また、別なページではNCQを無効にするとよいといった内容も見つかる。
http://www.itechlounge.net/2013/07/linux-ata-failed-command-read-fpdma-queued/
まずは、KVMイメージをNASにバックアップ(なんと前回バックアップしたのは2013-05-25とすごい昔)した。
次に、NCQを無効にして再起動してみる。
# cat /sys/block/sda/device/queue_depth 31 # echo 1 > /sys/block/sda/device/queue_depth # cat /sys/block/sda/device/queue_depth 1 #
エラーでまくり、前回より悪化しているような気がする。
smartctlを実行するため、smartmontoolsパッケージをyumでインストールした。
# smartctl -a /dev/sda smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.23.2.el6.x86_64] (local build) Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net === START OF INFORMATION SECTION === Model Family: Western Digital Caviar Green (Adv. Format) Device Model: WDC WD10EARS-00Y5B1 Serial Number: WD-WMAV******** LU WWN Device Id: 5 0014ee 001e20776 Firmware Version: 80.00A80 User Capacity: 1,000,204,886,016 bytes [1.00 TB] Sector Size: 512 bytes logical/physical Device is: In smartctl database [for details use: -P show] ATA Version is: 8 ATA Standard is: Exact ATA specification draft version not indicated Local Time is: Fri Feb 21 00:23:29 2014 JST SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x84) Offline data collection activity was suspended by an interrupting command from host. Auto Offline Data Collection: Enabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: (20880) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 240) minutes. Conveyance self-test routine recommended polling time: ( 5) minutes. SCT capabilities: (0x3031) SCT Status supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 199 197 051 Pre-fail Always - 2374 3 Spin_Up_Time 0x0027 141 124 021 Pre-fail Always - 5916 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 483 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0 9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 10601 10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 468 192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 140 193 Load_Cycle_Count 0x0032 001 001 000 Old_age Always - 816457 194 Temperature_Celsius 0x0022 117 106 000 Old_age Always - 30 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 6 198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 2 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 2 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 7744 - # 2 Conveyance offline Completed without error 00% 7740 - # 3 Short offline Completed without error 00% 7734 - # 4 Conveyance offline Completed without error 00% 7719 - # 5 Conveyance offline Completed: read failure 90% 7696 40 # 6 Conveyance offline Completed without error 00% 3322 - # 7 Conveyance offline Completed: read failure 90% 3300 2056 # 8 Conveyance offline Completed: read failure 90% 3294 2056 # 9 Short offline Completed: read failure 50% 3293 2056 4 of 4 failed self-tests are outdated by newer successful extended offline self-test # 1 SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
やっぱりやばそうである。
高橋 徹 さんが約11年前に更新
CentOS 6のインストール¶
/bootがやばそうなので、CentOS 6を新しいHDDにインストールすることとした。
CentOS 6.5のDVDイメージを入手し、DVDに焼く作業を実施¶
CentOSのミラーサイトから最寄のサイトを調べ、そこからDVDイメージファイルをダウンロードした。
サイトURL | ホップ数 | プロトコル |
---|---|---|
ftp.jaist.ac.jp | 11 | IPv6 |
ftp.tsukuba.wide.ad.jp | 11 | IPv6 |
ftp.riken.go.jp | 11 | IPv4 |
www.ftp.ne.jp | 91 | IPv6 |
ftp.iij.ad.jp | 14 | IPv6 |
mirror.fairway.ne.jp | 14 | IPv4 |
ftp.nara.wide.ad.jp | 12 | IPv6 |
1 9ホップ目で「あて先ネットワークに到達できません」となったので正確なホップ数は不明
今回は、ftp.riken.jpから次のISO形式ファイルをダウンロードし、ImgBurnでDVDに焼いた。
- CentOS-6.5-x86_64-bin-DVD1.iso
- CentOS-6.5-x86_64-bin-DVD2.iso
HDDの換装を実施¶
2台搭載しているHDDのうち、未使用の250GBを取り外し、3TBを装着した。
CentOS 6.5のインストール¶
PCを起動し、[Del]キーでBIOS画面に入るようにし、DVDドライブに CentOS-6.5-x86_64-bin-DVD1.isoを焼いたメディアを入れて起動した。
CentOS インストーラからインストールを実施。
その後、再起動するも新たな3TB HDDに入れたCentOSがブートできない。なぜか旧1TBのHDDをブートにいくし、それを除外したらこんどはネットワークインストールにいくのでどうやら3TB HDDがブート対象として認識されていない感じ・・・
調べると、2TB超えのHDDにはいろいろ制約があるらしい。
ブートできないと思っていたのは、/dev/sdb1がエラーを繰り返しだしていただけで、待っていれば/dev/sdaからブートできた。
ブート後¶
ちゃんとGPTでディスクが作成されていた
# fdisk /dev/sda WARNING: GTP (GUID Partition Table) detected on '/dev/sda'! The util fdisk doesn 't support GPT. Use GNU Parted. WARNING: The size of this disk is 3.0 TB (3000592982016 bytes). DOS partition table format can not be used on drives for volumes larger than (2199023255040 bytes) for 512-byte sectors. Use parted(1) and GUID partition table format (GPT). ...
ネットワークの設定¶
このPCには、NICが2つ搭載されているが、なんといずれもCentOS 6.5では認識できない!
そこで、elrepoからドライバを手動でコピーしインストールする。
http://mirror.symnds.com/distributions/elrepo/elrepo/el6/x86_64/RPMS/
- kmod-alx-0.0-8.el6.elrepo.x86_64.rpm
- kmod-e1000e-2.5.4-1.el6.elrepo.x86_64.rpm
この2つのファイルをダウンロードし、USBメモリへコピーし、PCにUSBメモリを装着し、
# mount -t vfat /dev/sdc1 /media
を実行した。
USBメモリのrpmをローカルにコピーし、インストールした。
# rpm -Uvh kmod-alx-0.0-8.el6.elrepo.x86_64.rpm
# rpm -Uvh kmod-e1000e-2.5.4-1.el6.elrepo.x86_64.rpm
ドライバのインストール後、/etc/udev/rules.d/70-persistent-net.rules を確認する。
# PCI device 0x8086:0x10d3 (e1000e) SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="XX:XX:XX:XX:XX:XX", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0" # PCI device 0x1969:0x1091 (alx) SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="XX:XX:XX:XX:XX:XX", ATTR{type}=="1", KERNEL=="eth*", NAME="eth1"
高橋 徹 さんが約11年前に更新
仮想ブリッジを使用したeth0,eth1の設定¶
KVMゲストがNATではなくbridgeでネットワークを使用できるようにするため、仮想ブリッジbr0, br1を作成しホストのネットワークeth0, eth1も仮想ブリッジ経由とする。br0はDHCPでIPアドレス取得、br1は固定IP割り当てとする。
- /etc/sysconfig/network-script/ifcfg-br0
DEVICE=br0 TYPE=Bridge BOOTPROTO=dhcp ONBOOT=yes
- /etc/sysconfig/network-script/ifcfg-br1
DEVICE=br1 TYPE=Bridge BOOTPROTO=none ONBOOT=yes NETMASK=XXX.XXX.XXX.XXX IPADDR=XXX.XXX.XXX.XXX
- /etc/sysconfig/network-script/ifcfg-eth0
DEVICE=eth0 ONBOOT=yes BRIDGE=br0
- /etc/sysconfig/network-script/ifcfg-eth1
DEVICE=eth1 ONBOOT=yes BRIDGE=br1
yum update実行¶
kernel-2.6.32-431.5.1.el6.x86_64 をはじめ65個のアップデートと1個のインストール(kernel)が実行された。
実行後、リブートしネットワーク設定が有効であったことを確認した。
ntpd設定¶
/etc/ntp.confを修正、サーバーをntp.nict.jpに変更し、chkconfigでntpdを自動起動するようにした。
KVMゲスト設定¶
元の設定ではbr1を使用するようになっていたが、今回br0を主ネットワークにしているのでbr0を使用するように設定(xml)を書き換え、virsh defineした。
サービス停止¶
不要なサービスを停止する。
iscsi, iscsid, lvm2-monitor, mdmonitor, netfs, nfslock, rpcbind, rpcgssd
高橋 徹 さんがほぼ8年前に更新
OSの入れ替え作業(Linux→Windows)
まず、SSDを新規購入し、HDDはすべて外した。
SSD: SanDisk UltraⅡ 240GB(SDSSDHII-240G-J26)
起動時にDELキーを押すと、ASUS UEFI BIOS Utility画面が表示される。DELキーを押さないと、OSブートを試みてブート可能なドライブがないため起動できない。
当初ブートデバイスにDVDマルチドライブが登場せず、BIOS設定をいろいろいじっているうちに認識した模様(きっかけは不明)。
Windows 10をインストール
- プロダクトキーなしでインストール実施
- NICの認識ができなかった。
→ 増設スロットのIntel NICはケーブル差し込み不足だった。 - インストール後、[スタート] > [設定] > [更新とセキュリティ] > [ライセンス認証] > [プロダクトキーを変更します] で、死蔵Windows 8 Proのプロダクトキーを入力したら認証された状態となった
高橋 徹 さんがほぼ8年前に更新
ESETのダウンロードとインストール
無線LAN対応について
無線LAN子機 Logitec LAN-W450AN/U2 を発見、ただしメーカーのWebサイトには、Windows 8対応までのドライバしか置かれていない。
http://dl.logitec.co.jp/software.php?pn=LST-D-320
ネット情報では
- MediaTek(旧Ralink社) RT3573 と同じ(OEM)
https://www.mediatek.jp/products/rt3573 - NEC Aterm WL450NU-AG もこのRT3573らしい