プロジェクト

全般

プロフィール

機器管理 #3

完了

PC F2AM85-V

高橋 徹 さんがほぼ8年前に追加. 1日前に更新.

ステータス:
終了
優先度:
通常
担当者:
カテゴリ:
-
開始日:
2013/06/22
期日:
2013/06/23

説明

自作PC-F2A85Vの管理情報を記録する。


子チケット 2 (0件未完了2件完了)

機器管理 #4: 自作PC F2A85-VのBIOSを更新する終了高橋 徹2013/06/222013/06/22操作
機器管理 #5: 自作PC F2A85-V CentOS 6.4でLANを認識させる終了高橋 徹2013/06/222013/06/23操作

関連するチケット

関連している 機能 #263: PC組み立て(#3後継)解決2021/03/142021/03/30

操作

高橋 徹 さんがほぼ8年前に更新

  • ステータス新規 から 進行中 に変更

Amazonで購入、2013-06-16手配、2013-06-18受領

購入時のBIOSバージョンは5023
ケースは標準状態(未使用ベイは蓋を付けている)
起動後、UEFI BIOS表示した状態でのデータを測定

  • 消費電力(ワットチェッカー): 122W
  • CPU温度: 59度、CPUファン回転数: 3770RPM
  • M/B温度: 39度

高橋 徹 さんがほぼ8年前に更新

  • 進捗率100 から 50 に変更

Linuxをインストール後に消費電力をワットチェッカーで調査した。
起動時:130W
Linux稼動中(アイドル状態):67W
Linux稼働中(KVMゲスト起動):74W
rtcwakeでスリープ(メモリ)中:3W

高橋 徹 さんがほぼ8年前に更新

LANカード インテル Gigabit CT Desktop Adapter EXPI9301CT を装着。
br1-eth1として設定

高橋 徹 さんが約7年前に更新

elrepoより、kmod-alx-0.0-8.el6.elrepo.x86_64.rpm を入手してアップデートインストールし、再起動したところ、
なかなか起動しなかった。コンソールを見ると、次のエラーが繰り返し出ていた。

Feb 20 21:09:10 bouchard kernel: ata2.00: irq_stat 0x40000008
Feb 20 21:09:10 bouchard kernel: ata2.00: failed command: READ FPDMA QUEUED
Feb 20 21:09:10 bouchard kernel: ata2.00: cmd 60/08:00:10:08:00/00:00:00:00:00/40 tag 0 ncq 4096 in
Feb 20 21:09:10 bouchard kernel:         res 41/40:00:10:08:00/00:00:00:00:00/40 Emask 0x409 (media error) <F>
Feb 20 21:09:10 bouchard kernel: ata2.00: status: { DRDY ERR }
Feb 20 21:09:10 bouchard kernel: ata2.00: error: { UNC }
Feb 20 21:09:10 bouchard kernel: ata2.00: configured for UDMA/133
Feb 20 21:09:10 bouchard kernel: ata2: EH complete
Feb 20 21:09:10 bouchard kernel: ata2.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0

そして、次のエラーメッセージも気になる

Feb 20 21:09:10 bouchard kernel: sd 1:0:0:0: [sda] Unhandled sense code
Feb 20 21:09:10 bouchard kernel: sd 1:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Feb 20 21:09:10 bouchard kernel: sd 1:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]
Feb 20 21:09:10 bouchard kernel: Descriptor sense data with sense descriptors (in hex):
Feb 20 21:09:10 bouchard kernel:        72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
Feb 20 21:09:10 bouchard kernel:        00 00 08 10
Feb 20 21:09:10 bouchard kernel: sd 1:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
Feb 20 21:09:10 bouchard kernel: Buffer I/O error on device sda1, logical block 2

エラーメッセージでぐぐると、こんなページが見つかる。HDDが故障間近で危険状態らしい。
http://kledgeb.blogspot.jp/2013/07/ubuntu-6-hdd.html

また、別なページではNCQを無効にするとよいといった内容も見つかる。
http://www.itechlounge.net/2013/07/linux-ata-failed-command-read-fpdma-queued/

まずは、KVMイメージをNASにバックアップ(なんと前回バックアップしたのは2013-05-25とすごい昔)した。
次に、NCQを無効にして再起動してみる。

# cat /sys/block/sda/device/queue_depth
31
# echo 1 > /sys/block/sda/device/queue_depth
# cat /sys/block/sda/device/queue_depth
1
#

エラーでまくり、前回より悪化しているような気がする。
smartctlを実行するため、smartmontoolsパッケージをyumでインストールした。

# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.23.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Green (Adv. Format)
Device Model:     WDC WD10EARS-00Y5B1
Serial Number:    WD-WMAV********
LU WWN Device Id: 5 0014ee 001e20776
Firmware Version: 80.00A80
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Fri Feb 21 00:23:29 2014 JST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84) Offline data collection activity
                                        was suspended by an interrupting command from host.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (20880) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 240) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x3031) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   199   197   051    Pre-fail  Always       -       2374
  3 Spin_Up_Time            0x0027   141   124   021    Pre-fail  Always       -       5916
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       483
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   086   086   000    Old_age   Always       -       10601
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       468
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       140
193 Load_Cycle_Count        0x0032   001   001   000    Old_age   Always       -       816457
194 Temperature_Celsius     0x0022   117   106   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       6
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       2
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       2

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      7744         -
# 2  Conveyance offline  Completed without error       00%      7740         -
# 3  Short offline       Completed without error       00%      7734         -
# 4  Conveyance offline  Completed without error       00%      7719         -
# 5  Conveyance offline  Completed: read failure       90%      7696         40
# 6  Conveyance offline  Completed without error       00%      3322         -
# 7  Conveyance offline  Completed: read failure       90%      3300         2056
# 8  Conveyance offline  Completed: read failure       90%      3294         2056
# 9  Short offline       Completed: read failure       50%      3293         2056
4 of 4 failed self-tests are outdated by newer successful extended offline self-test # 1

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

やっぱりやばそうである。

高橋 徹 さんが約7年前に更新

CentOS 6のインストール

/bootがやばそうなので、CentOS 6を新しいHDDにインストールすることとした。

CentOS 6.5のDVDイメージを入手し、DVDに焼く作業を実施

CentOSのミラーサイトから最寄のサイトを調べ、そこからDVDイメージファイルをダウンロードした。

サイトURL ホップ数 プロトコル
ftp.jaist.ac.jp 11 IPv6
ftp.tsukuba.wide.ad.jp 11 IPv6
ftp.riken.go.jp 11 IPv4
www.ftp.ne.jp 91 IPv6
ftp.iij.ad.jp 14 IPv6
mirror.fairway.ne.jp 14 IPv4
ftp.nara.wide.ad.jp 12 IPv6

1 9ホップ目で「あて先ネットワークに到達できません」となったので正確なホップ数は不明

今回は、ftp.riken.jpから次のISO形式ファイルをダウンロードし、ImgBurnでDVDに焼いた。

  • CentOS-6.5-x86_64-bin-DVD1.iso
  • CentOS-6.5-x86_64-bin-DVD2.iso

HDDの換装を実施

2台搭載しているHDDのうち、未使用の250GBを取り外し、3TBを装着した。

CentOS 6.5のインストール

PCを起動し、[Del]キーでBIOS画面に入るようにし、DVDドライブに CentOS-6.5-x86_64-bin-DVD1.isoを焼いたメディアを入れて起動した。
CentOS インストーラからインストールを実施。
その後、再起動するも新たな3TB HDDに入れたCentOSがブートできない。なぜか旧1TBのHDDをブートにいくし、それを除外したらこんどはネットワークインストールにいくのでどうやら3TB HDDがブート対象として認識されていない感じ・・・

調べると、2TB超えのHDDにはいろいろ制約があるらしい。

ブートできないと思っていたのは、/dev/sdb1がエラーを繰り返しだしていただけで、待っていれば/dev/sdaからブートできた。

ブート後

ちゃんとGPTでディスクが作成されていた

# fdisk /dev/sda

WARNING: GTP (GUID Partition Table) detected on '/dev/sda'! The util fdisk doesn
't support GPT. Use GNU Parted.

WARNING: The size of this disk is 3.0 TB (3000592982016 bytes).
DOS partition table format can not be used on drives for volumes
larger than (2199023255040 bytes) for 512-byte sectors. Use parted(1) and GUID
partition table format (GPT).

...

ネットワークの設定

このPCには、NICが2つ搭載されているが、なんといずれもCentOS 6.5では認識できない!

そこで、elrepoからドライバを手動でコピーしインストールする。
http://mirror.symnds.com/distributions/elrepo/elrepo/el6/x86_64/RPMS/

  • kmod-alx-0.0-8.el6.elrepo.x86_64.rpm
  • kmod-e1000e-2.5.4-1.el6.elrepo.x86_64.rpm

この2つのファイルをダウンロードし、USBメモリへコピーし、PCにUSBメモリを装着し、

# mount -t vfat /dev/sdc1 /media

を実行した。

USBメモリのrpmをローカルにコピーし、インストールした。

# rpm -Uvh kmod-alx-0.0-8.el6.elrepo.x86_64.rpm

# rpm -Uvh kmod-e1000e-2.5.4-1.el6.elrepo.x86_64.rpm

ドライバのインストール後、/etc/udev/rules.d/70-persistent-net.rules を確認する。

# PCI device 0x8086:0x10d3 (e1000e)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="XX:XX:XX:XX:XX:XX",
 ATTR{type}=="1", KERNEL=="eth*", NAME="eth0" 

# PCI device 0x1969:0x1091 (alx)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="XX:XX:XX:XX:XX:XX",
 ATTR{type}=="1", KERNEL=="eth*", NAME="eth1" 

高橋 徹 さんが約7年前に更新

データ移行

KVM関連

  • 旧HDDの/var/lib/libvirt/images/*.imgを、新HDDの/var/lib/libvirt/images以下にコピー
  • 旧HDDの/etc/libvirt/qemu/*.xmlを、新HDDの/etc/libvirt/qemu以下にコピー
  • 各ゲスト毎に、virsh define /etc/libvirt/qenu/xxx.xml を実行

高橋 徹 さんが約7年前に更新

仮想ブリッジを使用したeth0,eth1の設定

KVMゲストがNATではなくbridgeでネットワークを使用できるようにするため、仮想ブリッジbr0, br1を作成しホストのネットワークeth0, eth1も仮想ブリッジ経由とする。br0はDHCPでIPアドレス取得、br1は固定IP割り当てとする。

  • /etc/sysconfig/network-script/ifcfg-br0
    DEVICE=br0
    TYPE=Bridge
    BOOTPROTO=dhcp
    ONBOOT=yes
    
  • /etc/sysconfig/network-script/ifcfg-br1
    DEVICE=br1
    TYPE=Bridge
    BOOTPROTO=none
    ONBOOT=yes
    NETMASK=XXX.XXX.XXX.XXX
    IPADDR=XXX.XXX.XXX.XXX
    
  • /etc/sysconfig/network-script/ifcfg-eth0
    DEVICE=eth0
    ONBOOT=yes
    BRIDGE=br0
    
  • /etc/sysconfig/network-script/ifcfg-eth1
    DEVICE=eth1
    ONBOOT=yes
    BRIDGE=br1
    

yum update実行

kernel-2.6.32-431.5.1.el6.x86_64 をはじめ65個のアップデートと1個のインストール(kernel)が実行された。
実行後、リブートしネットワーク設定が有効であったことを確認した。

ntpd設定

/etc/ntp.confを修正、サーバーをntp.nict.jpに変更し、chkconfigでntpdを自動起動するようにした。

KVMゲスト設定

元の設定ではbr1を使用するようになっていたが、今回br0を主ネットワークにしているのでbr0を使用するように設定(xml)を書き換え、virsh defineした。

サービス停止

不要なサービスを停止する。

iscsi, iscsid, lvm2-monitor, mdmonitor, netfs, nfslock, rpcbind, rpcgssd

高橋 徹 さんが約7年前に更新

lm_sensors-3.3.5をソースからインストール

make, make install

/usr/local/bin等にファイルがインストールされた

$ /usr/local/bin/sensors
k10temp-pci-00c3
Adapter: PCI adapter
temp1:         +5.6°C  (high = +70.0°C)
                       (crit = +70.0°C, hyst = +69.0°C)

あまり情報が得られない・・・

高橋 徹 さんがほぼ4年前に更新

OSの入れ替え作業(Linux→Windows)

まず、SSDを新規購入し、HDDはすべて外した。
SSD: SanDisk UltraⅡ 240GB(SDSSDHII-240G-J26)

起動時にDELキーを押すと、ASUS UEFI BIOS Utility画面が表示される。DELキーを押さないと、OSブートを試みてブート可能なドライブがないため起動できない。

当初ブートデバイスにDVDマルチドライブが登場せず、BIOS設定をいろいろいじっているうちに認識した模様(きっかけは不明)。

Windows 10をインストール

  • プロダクトキーなしでインストール実施
  • NICの認識ができなかった。
    → 増設スロットのIntel NICはケーブル差し込み不足だった。
  • インストール後、[スタート] > [設定] > [更新とセキュリティ] > [ライセンス認証] > [プロダクトキーを変更します] で、死蔵Windows 8 Proのプロダクトキーを入力したら認証された状態となった

高橋 徹 さんがほぼ4年前に更新

ESETのダウンロードとインストール

無線LAN対応について

無線LAN子機 Logitec LAN-W450AN/U2 を発見、ただしメーカーのWebサイトには、Windows 8対応までのドライバしか置かれていない。
http://dl.logitec.co.jp/software.php?pn=LST-D-320
ネット情報では

高橋 徹 さんが1日前に更新

  • 関連している 機能 #263: PC組み立て(#3後継) を追加

高橋 徹 さんが1日前に更新

  • ステータス進行中 から 終了 に変更

[#263]でマザーボードから換装したので、本PCは運用停止。

他の形式にエクスポート: Atom PDF