3 件のコメントがあります。

スパムブロック機能により、投稿が失敗することがあります。
うまくいかない場合は、一行目だけをまず投稿し、そのあと編集から残りを追記してみてください。

1 - 3 / 3

Lion ServerでiCal, Wiki, Podcast, プロファイルマネージャーが起動できなくなる

From : namahage @ 2014-04-15 09:27:08 編集 引用

Lion Serverの運用中,特に何かをしたわけでもないのに,Server.appからiCal, Podcast, Wiki, プロファイルマネージャーが「設定の読み込みに失敗しました」と表示され,起動が出来なくなってしまいました。さらにはAdmin ToolsのDNSも「停止」の状態になってしまいました。

私の場合,心当たりがあるのは,この現象が起きる直前に,FileMaker Pro Server 11の移行を行っていたことした。こひょっとしてFMP Serverとのバッティングか何かではないかとずいぶんと慌て,呪いましたが,最終的にはそうではないことがわかってきました。FMPSは無罪でした。

この障害発生時も,それぞれのサービスのほとんどの機能は稼働しているようで(おそらく完全ではない),どうもServer.appでの表示上は,停止して見えるようです。
logや実際にサービスを利用すると,iCalサーバーに接続も出来ますし,Wikiもトップ画面までは表示できます。DNSも機能しているのが確認できました。

System.logを読むと,特徴的なlogが大量に出力されているのがわかります。
serveradmin: servermgr_postgres: waiting for postgres to respond
serveradmin: servermgr_postgres: Timed out trying to start postgres.

servermgrd: servermgr_wiki: wikiconfig faild: /usr/share/collabd/server/ruby/lib/collaboration/service_client.rb:42:in `http_put': Couldn't connect to server (Curl::Err::ConnectionFailedError)
(com.apple.collabd.notifications): Throttling respawn: Will start in 10 seconds
などです。

また,Postgresのログを読むと

role role "collab" does not...

などのエラーが続いてshut downしていることがわかります。

これらの情報から,おおざっぱに解釈すると,posgtresとcollabdに原因があるように読める障害です。
Client版からサーバー化させていく手法と違い,Server版のようにパッケージ化された状態からの実運用をおこなっているなかで,この手のトラブルは体力と時間的に心拍数が上がります。

海外のDiscussionsを読みあさり,わかってきたのは,かなりのServer版ユーザーがこの現象に遭遇しており,その解決に苦悩していると言うことです。局所的にiCalサーバーだけであったり,devicemanagerだったりいくつかケースが存在するようではありますが,いずれもこのpostgres関連に基因するトラブルに巻き込まれている例が見受けられます。

https://discussions.apple.com/thread/3208533?start=0&tstart=0
https://discussions.apple.com/thread/3200022?start=30&tstart=0
https://discussions.apple.com/message/19937861#19937861

それらの書き込みからわかってきたことは,この現象のトリガーにあたるのは「再起動」にあるようです。かなりのユーザーが,再起動後にこの現象に巻き込まれているように思います。

いろいろ読みあさっては見ましたが,直接の発生機序はわかりませんでした。
予想されるのは,

「再起動時,どうもpostgresのデータベースを破損させる現象が起きている」

または

「/Library/Logs/Postgres.logが存在しない,またパーミッションが不適切」

などでしょうか。

discussionsには,再起動を繰り返すうちになおった,とか,rootユーザーを有効にしたらなおったなど,いくつか対処法があげられていましたが,とりあえずのところ,私が解決にいたった手順をまとめておきます。(sudo後に求められるパスワードは管理ユーザーのパスワードです)

1, 全てのサービスを可能な限り停止させる
2, 再起動,シングルユーザーモードで起動(つまりcommand + Sで起動)
3, fsck -fyを実行,修復処理後,rebootを実行
4, 起動後,ディスクユーティリティでアクセス権の修復を実施
5, 再起動,セーフモードで起動(つまりshiftキーを押したままで起動)
6, ディスクユーティリティでアクセス権の修復を実施
7, 再起動,通常の起動
8, ターミナルを起動
9, cd /Library/Logs/
10, sudo mkdir PostgreSQL
11, cd PostgreSQL
12, sudo touch PostgreSQL.log
13, sudo chmod -R 755 _postgres:_postgres
14,再起動
15, ターミナルを起動
16, sudo serveradmin start postgresを実行し,「postgres:state = "RUNNING"」と返してくるのを確認する。ERRなどのときは,もう一度セーフモードで起動をするところからやり直し。
17, sudo psql -U _postgres -d postgres を実行
18,「postgres=#」と走る
29, 「\q」 と入力しててリターン(半角バックスラッシュ とqです)
20, postgresを抜ける
21, cd /System/Library/ServerSetup/CommonExtras/PostgreSQLExtras/を実行
22, sudo ./CoreCollaborationPostgreSQLExtras.shを実行
23, ずざざざといろいろ表示されながらデータベースが再構築されていきます
24, 可能なら再起動
25, 起動後,Server.appを起動し,各サービスが復旧していることを確認する

以上の操作で,復旧することが出来ました。
おそらく,意味があると思われる操作は,9番目以降だと思います。

Re: Lion ServerでiCal, Wiki, Podcast, プロファイルマネージャーが起動できなくなる

From : namahage @ 2014-04-15 09:33:08 編集 引用

上記の処理で,復旧後も,数分後,症状が再発しました。

原因はよくわかりませんが,なんとなく,「再起動」,「画面共有で別ユーザーで仮想的にログイン」,「ファーストユーザースイッチによるログイン」などが,あげられます。

再発後の症状はかなり面倒で,結局,TimeMachineから正常動作時のPostgres関連データを取り出し,復旧させました。
元に戻したのは次のディレクトリ。

/var/pgsql

/var/pgsql_socket

です。
復元後,ターミナルで,

sudo ls -al /var/pgsql

sudo ls -a /var/pgsql_socket

を実行し,内部のファイル類のオーナーやグループが_postgresになっていることを確認し,再起動しました。
Postgresが無事起動するようになり,復旧となりました。

Re: Lion ServerでiCal, Wiki, Podcast, プロファイルマネージャーが起動できなくなる

From : namahage @ 2015-07-07 17:45:31 編集 引用

Postgresがこけて、各種サービスが起動できなくなる問題についてのその後です。

上記ではごちゃごちゃやっていますが、楽に復旧をさせるには次の方法で良いことに気がつきました。

serveradmin: servermgr_postgres: waiting for postgres to respond

のようなエラーが続発するときは、
とりあえず、システム再起動を一度実行します。
再起動後、Server.appを起動すると、いずれのサービスも死んだままですが、とりあえずじっくり待って、Server.appの内部処理が一通り終わるのを待ちます(ぐるぐるがだいたい終わるまで、警告リストを更新中ぐらい見送っても良い)。
終わったら、メニューからServer.appを終了し、もう一度再起動をかけます。

だいたい2度再起動をすると、次は無事に起動をしてくれるようになるようです。
内部のダメージレベルにはよると思いますが。

Post Your Comment


*は入力必須です。E-Mailは公開されません。