Category Archives: Server関連記事

エッジサーバーアプリケーション屋外設計時の課題と潜在リスク

Allion Labs  近年、エッジサーバーテクノロジーはさまざまな分野で急速に発展しており、スマートシティやスマートモビリティでよく使われているエッジAIやエッジコンピューティングサーバーなど、屋外環境でも広く使用されています。これらのエッジサーバーは屋外に設置されるため、防水・防塵性を考慮してファンレス設計が採用されることが多く、また設置場所を考慮して小型に設計されていることが一般的ですが、小型かつファンレス設計であるがゆえに、放熱性や耐久性に問題があります。 屋外環境での最大の課題は温度変化 例えば、熱帯地域では、夏季の高温に加えて太陽の直射日光のせいで、エッジサーバーの温度が60度以上の高温に達する可能性がある一方で、寒帯地域では冬の夜間の気温が-40度以下になることがあります。また、昼夜の温度差が大きい地域や季節によっては、温度差が40度以上に達することもあります。 屋外でのエッジサーバーアプリケーションの潜在的なリスクは次のとおりです。 ファンのない設計であれば、昼間高温になったエッジサーバーが効果的に冷却されない可能性があり、強制シャットダウンを引き起こす可能性がある 夜間の低温のせいで電子コンポーネントの動作しなくなり、エッジサーバーが起動しなくなる可能性がある 長時間にわたる昼夜の温度変化により、エッジサーバーの寿命が短くなる可能性がある 上記の潜在的なリスクによりエッジサーバーの故障が起こると、スマートシティやスマートモビリティが「スマート」に機能しなくなり、さまざまな混乱や交通事故の原因となる可能性があります。 上記の3つの潜在リスクに対処するために、アリオンは評価に関する一連のコンサルティングサービスを提供することができます。 動作モードでの最高温度と最低温度の最大限界値を評価する 損傷して修復不可能な最高温度と最低温度の極限値を評価する 展開された屋外環境での使用シナリオに基づいて混合テスト(高温/低温)をシミュレーションし、正常に動作するか確認する 極限値に基づいて予想保証期間を評価する [...]

輸送用機器のサーバーにおける「脅威」とは?

Allion Labs  高性能サーバー演算の重要性 インフォメーションテクノロジーで強化されたデジタル時代において、より高性能で安定した計算が求められています。こうした需要が増加し続け、テクノロジーも進化を続けることで、サーバーの計算性能は加速度的に向上しています。さらに、サーバーの大きさは縮小し続ける一方で、サーバーのアプリケーションは集中型データセンターからエッジコンピューティング、さらにはエンドプロダクトにまで拡大しています。移動で使う輸送用機器もサーバーの重要なアプリケーションの一つで、航空、海運、陸運、普段の生活から軍事や科学などの特定の用途に至るまで、輸送用機器が移動する際に起こるさまざまな状況に対処するためにサーバーが使われています。車載サーバーを例に挙げれば、交通状況の検知や異常事態を迅速に処理して通知し、障害物の回避や緊急ブレーキをサポートしていますが、いずれも高性能サーバーの計算によって、こうした迅速な処理が実現しています。 3大脅威に対処するために、どのように評価して保護措置を実行すべきか? 輸送用機器のサーバーが故障すると、非常に深刻な影響を引き起こし、個人または多くの人々の生命が脅かされる可能性があります。 輸送用機器のサーバーが故障する最大の潜在的なリスクは、「長時間の高温/低温や、激しい温度変化」と「移動中の振動」です。 長時間の高温または低温は、サーバーの強制シャットダウンを引き起こす可能性がある 激しい温度変化は、電子部品の急激な熱膨張と収縮を引き起こし、故障の原因となる可能性がある 振動が続くと部品の緩みや脱落を引き起こす可能性があり、サーバーの故障につながる 航空機を例にとると、離陸時と着陸時に急激な温度変化が発生し、一定高度の飛行時には極端な低温環境にさらされ、飛行中は常に振動が発生します。 一方、自動車も似たような状況に遭遇する可能性があります。氷雪や砂漠のような過酷な気候で走行することがあり、走行中に振動が継続して発生し、道路状況によっては急激なアップダウンがあるかもしれません。 上述した3つの潜在的なリスクに対し、アリオンは以下のような包括的なコンサルティングサービスを提供します。 動作モードにおける最高温度と最低温度、振動の最大限界値を評価する 損傷後に復元できない最高温度と最低温度、振動限界値を評価する [...]

サーバー高速アドインカードの機能が動作しない背景と原因

Allion Labs  テクノロジーの進化に伴いに、高周波/高速の転送規格も向上し続けており、サーバー産業で広く使用されているPCIe技術もその一つです。現在の製品でサポートされているPCIe 5.0を例にとると、周波数は16GHzに達し、転送速度は32GT/sになります。しかし、高周波によりPCB基板の信号減衰が増加するという特性から、メーカーは製品開発においてより大きな課題に直面しています。こうした信号の伝送距離と減衰の問題を解決するために、ケーブルを使用する設計が増えており、高速コネクタとケーブル応用の多様化が進んでいます。 互換性の問題の下に隠れている潜在的なリスク 高周波の特性に対する注意だけでなく、高速コネクタの量産時において、メカニカルの精度が安定しているかも無視できない重要なポイントです。精度が安定していない場合、他のメーカーのボードやケーブルとの互換性の問題が発生する可能性が非常に高くなります。 簡単な例を挙げると、高速コネクタのサプライヤーが3つあり、それぞれ異なるボードやケーブルと組み合わせる場合、単純にこれだけでサーバーの製造組み立てプロセスで9つの異なる組み合わせが生まれます。そのうちの1つに互換性の問題が発生した場合、その組み合わせで組み立てられたサーバーは、出荷時に以下の潜在的なリスクに直面する可能性があります:  1. 位置ずれ(Misalignment) 両端のサプライヤーが仕様の公差許容範囲の上下限の位置に設計している場合、生産時に各コネクタの公差精度を確実かつ安定して制御できないと、位置ずれの互換性の問題が発生し、それによりボードやケーブルの接続後に機能が失われる可能性があります。  2. ピンの接触面積が小さすぎる  ボードやケーブルの接続後に機能は正常でも、ピンの接触面積が小さすぎるため、信号の反射と減衰が生じ、データ転送速度と安定性に影響を及ぼす可能性があります。 サーバー分野において、高速コネクタをボードに組み合わせる際、両端のピンの位置ずれが発生したせいで、ボードの機能が起動できないという事例が過去に実際にありました。その原因は、異なるサプライヤー間の組み合わせによる互換性の問題でした。大量に出荷され、エンドカスタマーがサーバーを展開し始めた時になって上記の潜在的なリスクが明らかになれば、メーカーはそのロットのサーバーを回収して交換しなければならず、エンドカスタマーのサーバー展開と関連サービス提供のスケジュールを遅延させるだけでなく、会社の評判や製品イメージ、収益に深刻なダメージを受けることになります。 Faster, [...]

AIと高速演算時代の到来:ホワイトボックスサーバーに潜むリスクとは?

Allion Labs  32GT/sのPCIe 5.0製品が市場に登場したことで、高速演算とAI人工知能の効果が顕著になっています。特に生成AIがすぐに人々の日常生活に浸透し、次第に様々な産業で重要な役割を果たすと同時に、高速伝送へのニーズも増加しています。この影響からサーバー市場は持続的な成長を続け、サーバーの世代アップグレードサイクルも短縮しています。 こうした中、個別のサーバー運用環境に最適化した設計のニーズが拡大しています。カスタマイズしたサーバーを購入したお客様にとって、運用コストの削減できる利点がありますが、分散調達後のケース、マザーボード、ストレージデバイスなどの組み立てによるシステム安定性は懸念されます。 さらに、マザーボードに高速のPCIe 5.0技術が導入され始めると、このようなサーバーはより深刻な潜在リスクに直面する可能性が高いと考えられます。 ホワイトボックスサーバーに潜む5大リスク  1. 冷却効果の不均衡  PCIe 5.0をサポートするCPUのTDP(Thermal Design Power)は350W以上で、冷却要件が非常に高くなっています。マザーボードによってCPUの設計位置が異なり、ケース内のファンに完全に対応することができないため、CPUの冷却が均一にならない問題が発生する可能性があります。  2. [...]

サーバーの安定性要件 – 振動と機械的衝撃

Allion Labs  毎日数十億もの人がインターネットを利用し、絶えずデータがクラウドに生成・保存されています。これらのデータは、ストレージサービスを提供する企業やプラットフォームによって、数百万にも上るハードディスクを備えたデータセンターに保存されます。データを保存・処理するためのコンピュータハードウェアデバイスであるサーバーは、通常ラックに取り付けられ長時間稼働する必要があります。個人用パソコンのハードディスクと似ていますが、サーバー内に取り付けられたハードディスクは、サイズが大きく数も多いです。サーバーデータ処理センターには、多くのハードディスクが上下に積み重ねられ、所謂筐体(シャーシまたはケース)内に配置され、複数の筐体がキャビネット内に配置されます。データセンターには非常に多くのキャビネットがあり、インターネットユーザーは、リモートでハードディスク内のデータにアクセスしているわけです。 しかし、ハードディスクは振動に非常に敏感であり、振動でハードディスクが損傷する場合があります。ストレージユニット全体には主に3つの振動源があり、ハードディスクの性能低下を引き起こします。 冷却用ファンの音による負荷 ストレージユニット上のファン振動の負荷、筐体を伝わって発生する振動と共振 ハードディスク自体の振動負荷 振動問題に対する研究は、励振(excitation)、システム、レスポンスの定義方法に関するものや、これら3つの関係を研究したものばかりです。励振は作用力およびエネルギーの源で、レスポンスは私達が関心を寄せる励振作用を受けた位置での振動反応のこと、システムは機械波が励起からレスポンスまでの間に物体を通過する範囲をそれぞれ指します。 例えば、サーバー内のハードディスクは、特定の周波数で大きな回転振動を受けると、性能が大幅に低下します。こうした問題では、ファンが励振源、ハードディスクと筐体の接続部の振動反応がレスポンス、筐体と関連する接続部品がシステムとなります。例えば、サーバー筐体の構造を設計する人は、自身の設計で冷却ファンを装着した後、ハードディスクの取り付け部の回転振動レスポンス特性がどうなるのか、特定の周波数で振幅が過大になるかどうか気にして設計します。 そのため、サーバーが極端な環境下で正常に動作するように、信頼性テストや耐久性テストなどの一連の関連テストを実施する必要があります。その中には、振動テストや機械的衝撃テストが含まれます。 1. 振動テスト:実際の作業環境で発生する可能性のある振動環境をシミュレーションするため、サーバーを異なる周波数や振幅の機械振動にさらします。これにより、サーバーがこのような環境で正常に動作し、ハードウェアコンポーネントに損傷や障害を引き起こすかどうかを確認することができます。 2. 機械的衝撃テスト:サーバーに突発的な衝撃を与え、予期しない衝突や落下に耐えられるかをテストします。これにより、サーバー輸送中に物流会社の運搬に耐えられるか、実際の使用中にどの程度の衝撃に耐えられるかを確認することができます。例えば揺れる車両の上など、サーバーが不安定な場所に設置されている場合、振動により故障する可能性があります。また、例えば衝突や落下するなどしてサーバーが強い衝撃を受けた場合、異常を引き起こす可能性があります。 サーバーが振動テストや機械的衝撃テストに合格しない場合、以下の影響が考えられます [...]

サーバー冷却ファンのノイズと振動がOCP HDDのパフォーマンスに与える影響を実測

Allion Labs / Joseph Lin 近年、クラウドコンピューティングとクラウドストレージの急速な成長に伴い、ネットワークサービスプロバイダーのサーバー需要が高まっています。クラウドサービスプロバイダーは、大量の情報にアクセスするユーザーのニーズを満たすことができるハードウェアを提供するために、さらに多くのデータセンターを構築し続ける必要があります。また、サーバー自体の性能要件やストレージスペースも、各種のストリーミングメディア(Netflix、Disney+、Spotifyなど)の流行に対応して、高度に成長してきました。 ハードディスクの安定性に対する大きな課題 ― 冷却ファンが起こす振動やノイズ サーバーで使用されるCPUやハードディスクドライブ(以下HDD)も、この数年間、性能とストレージスペースの需要に対応して高度に成長しています。CPU性能の向上は、より高い電力消費をもたらし、HDDの容量も倍増しました。 サーバー内にある他の部品も、CPUの能力向上に応じてその性能が向上し、消費電力も増加しました。 サーバー全体の消費電力が増加すると、それに応じてサーバーの冷却ニーズも高まります。冷却ファンはサーバー冷却システムの主要コンポーネントであるため、サーバーに蓄積された熱を、サーバーケースの外側に吐き出すのに十分な風量を提供するために、ファンの回転数がますます増加します。しかし、冷却ファンの回転数が増加するにつれて、冷却ファンが起こす振動やノイズも大きくなり、結果的にサーバー内の他の部品に影響を与えてしまいます。   HDDは、サーバー内で冷却ファンの振動とノイズの影響を最も受けやすい部品です。 今までの経験と研究によると、HDDのパフォーマンスに影響を与える振動は、次のいずれかから発生する可能性があります。 システム動作時の振動 HDDとHDDの間で相互に伝達する振動 [...]

サーバーの安定性要件 – 温度と湿度

Allion Labs  インターネット時代において、膨大なデータ処理と世界数十億人が利用するインターネットサービスにより、サーバーは重要な役割を果たしています。2023年のサーバー市場は、ハイブリッドワークが新しい働き方として登場してからも、依然としてクラウドデータセンター事業者の需要が顕著です。Google、Amazon、Microsoftなどのクラウドサービスは、正確で安定したサービスパフォーマンスを実現するために、高速で適切に設計された大容量のサーバーを必要としています。この様に、サーバーの応用範囲は非常に広く、多くの人々のインターネット利用に関係しているため、ネットワークサービスがあるところにはサーバー構築のニーズが多くあり、いかにサーバーを安定して運用するかが重要な課題となっています。 例: Facebookは、北極圏から100キロメートルしか離れておらず、冬の平均気温がマイナス20度に達するスウェーデンのとある場所にデータセンターを建設しました。 Microsoftは、スコットランドのオークニー諸島沿岸付近の水域に、潜水艦に似たデータセンターを展開しています。 eBayは、平均気温が38度を超えるアメリカの・フェニックスの砂漠に、20年間使用するデータセンターを建設しました。 現在知られているデータセンターは、極地気候、砂漠地帯、海洋水域に建設されています。高温の環境ではサーバーの放熱効率が低下し、運用が低下する可能性があります。また、乾燥しすぎた環境では電子機器に静電気がたまりやすく、湿度が高いと電子部品が腐食する可能性があります。長期的な観点から見れば、こうした問題がより深刻な摩耗や故障を引き起こす可能性があり、高額の投資コストで無駄が多くなるだけでなく、管理の面で多くの問題を引き起こすことになります。 研究によると、データセンターの理想的な温度の範囲は22℃〜23℃で、できるだけ35℃を超えないように、相対湿度の範囲は40%〜60%の間で保つ必要があります。いかにして安定した作業効率と温度・湿度の最適なバランスを得るかは、厳密かつ大量のテストが必要とし、データに基づいて調整し、包括的なサーバーシステムを完成させることで、完全な性能と寿命を発揮することができます。 したがって、サーバーが様々な温度・湿度環境の気候条件下で動作するかや、作業状態で正常で安定した高効率動作を維持するために良好な冷却システムがあるかが、考慮しなければならない問題となっています。 Facebook、Microsoft、Googleなど、ほぼ全世界のユーザーをカバーしている企業のデータセンターにある1台のサーバーに、平均数百から数千人のユーザーが同時に接続しています。環境の温度や湿度の問題でサーバーがダウンして動作しなくなった場合、その影響は全世界の個人ユーザーや企業に及び、損失は計り知れません。 そこで、アリオンは65KWのウォークインチャンバー( Walk-in Chamber)を設置し、サーバーの信頼性、温度、湿度に対するテストを実施することができます。 65KW ウォークインチャンバー[高重量積載、大容量収納、高い放熱性能を備えています] [...]

アリオンSIT(System Integration Test)検証サービスのご紹介

システムインテグレーションテスト(以下SIT)は、ソフトウェアテストの一種であると同時に、ソフトウェア開発ライフサイクルの1つの段階で、通常は単元テストと受け入れテストの後に実施されます。SITテストでは、各システムコンポーネントが統合されてテストされ、正常に動作するかを確認します。 ソフトウェアテストの中でも、SITは最も手間のかかる人的資源を必要とし、問題が最も多いテストでもあります。テスト内容だけでなく、各アイテムとサプライヤーの納期も含まれるため、テストのスケジューリング全体に影響し、システムバージョンの更新も出荷時間に影響を与えます。 SITの紹介とその効果 このテストは通常​​、以下のテストの側面をカバーしています。 1. SIT:システム全体の様々なコンポーネントを適切に統合できるかを確認します。 2. 機能テスト:システムの各機能が正常かどうかをテストします。 3. インターフェーステスト:システム間のインターフェースが正しく接続され、相互作用するかをテストします。 4. パフォーマンステスト:システムの応答時間やスループットなど、システムの性能が期待に沿うかをテストします。 5. セキュリティテスト:身分認証、承認などのテストを含め、システムが十分なセキュリティ保護を備えているかをテストします。 6. [...]