無線LANのさらなる活用に向けて(後編)
AIを活用したIT運用(AIOPs)と頼れる「副操縦士」

 2022年12月15日

topイメージ

無線LANのさらなる活用に向けて(前編)では、「無線LAN安定運用のベストプラクティス」について下記の表にある6つのテーマに沿って、これまでの技術や以前からお馴染みの内容を含めた、いますぐ試してほしい内容をご紹介しました。

そして今回の後編では、従来のやり方に新しい技術を組み合わせ、さらなる安定運用を実現するためのお話です。
無線LANを含むネットワークのさらなる安定運用の新技術としてガートナー社が提唱し、注目されているAIを活用したIT運用「AIOPs(Artificial intelligence for IT Operations)」についてです。
Extreme社(旧 Aerohive社)の無線LAN製品の販売活動に携わっている弊社から、AIを実務レベルで活用するためには何が必要か、また、Extreme社が取り組んでいるAIOPsの新製品についてもお伝えします。

1. 既存の技術でできることとできないこと

無線LANのさらなる活用に向けて(前編)での内容は無線LANの運用管理をされているエンドユーザ様の管理者様や代理店の営業・SEの皆様にはすでにお馴染みの内容であったかもしれません。

無線LAN安定運用の成功の秘訣とは?サムネイル
無線LANのさらなる活用に向けて(前編)
無線LAN安定運用の成功の秘訣とは?
詳しく見る 

前回のおさらいとなりますが、無線LAN安定運用の成功の秘訣として下記の表1にある6項目が重要であるとお話しました。

無線LAN 安定運用のベストプラクティス(表1)
   
安定運用の要素 テーマ 内容
システムデザイン 製品選定
  • 究極にシンプルで障害ポイントのないシステム構成を実現できる製品を採用する
導入時の設計
  • 全拠点共通な設定情報に調整する
  • デフォルト設定(チューニング設定しない)最優先
  • 慎重にファームウェアを選定する
  • Syslogサーバを設定する
運用体制の充実度 導入直後の微調整
  • データやログによる前システムと比較検証を実施し安定運用ができることの確認をする
定期メンテナンス
  • 計画的にファームウェアを選定しアップグレードする
トラブル発生時の切り分けと解決方法
  • 切り分けのための環境面の情報収集
  • データに基づく原因究明のための基盤を整備する
  • Techデータのタイムリーな取得と解析
  • Syslogサーバのログの解析
拡張や移転などの変更対応
  • 導入時の設計内容に基づき、個別対応しない
  • 本社移転やM&Aなどの大きなイベントには、元の設計内容を再検討する

Extremeの無線LAN製品(旧Aerohive)を採用いただいている皆様は、クラウドにもAPにもコントローラがない「完全コントローラレス型」の最もシンプルな無線LANの制御アーキテクチャーですので、表1の「製品選定」時の内容「究極にシンプルで障害ポイントのないシステム構成を実現できる製品を採用する」は既にクリアされている項目となります。

この6項目こそが「既存の技術で出来ること」ですが、「既存の技術ではできないこと」とは一体何でしょうか?

それは、「AIを活用して利用者がトラブルに気付く前に、トラブルの予兆を見つけて対策を打てる状態にすること」です。

これこそが、ガートナー社が提唱しているAIOPs(Artificial intelligence for IT Operations:エーアイオプス)= AI を活用した IT 運用 です。

ある日時にある場所である端末にトラブルが起きます!という予報を発表して、的中させることは今の技術では難しいかもしれませんが、

なにか調子がいつもと違う?
これはトラブルの予兆かもしれない!

ということが事前に判れば運用管理者にとって非常に有効となります。

ただ、表1の6項目を実行するための各種事情や配分されるリソースが足りないことにより、十分に実践されていない場合、潜在的には「いつ問題が起きてもおかしくない状態」となっているともいえます。
つまりこの状態では新しい技術であるAIを駆使しなくても解決できる問題がまだまだ残っているかもしれない状態ですので、新しい技術であるAIの導入は時期尚早となる可能性が高く、「いますぐAI導入に投資する必要がない」とも考えられます。

表1の6項目をある程度実施して体制が整った上で、新しい技術であるAIをご提案することこそがエンドユーザ様に対して誠実であるはず、というのが弊社の考え方です。
AIの技術を駆使した新サービスが出たからと、やみくもに「これを導入するともう大丈夫です!是非!!」というような提案をすることは適切ではないと考えています。

2. よくある無線LANのトラブル

良好な状態の無線LAN環境であってもトラブルが起きることはあります。
例えば、ハードウェア故障以外に下記のようなことが申告されることがあります。

「原因がよくわからないが某フロアの某ユーザの端末がWEB会議中に切れてしまう」

「しばらくは、コロナ禍で社員の出社が少ない状況だったが、最近多くの人が出社するようになったとたんに無線LANが遅いといわれることが多くなった」

多くの申告が個別のユーザの固有の問題であって、全社一斉に発生しているわけではないため、まずは個別環境に起因する問題であるという仮説に基づいて対応していくことになります。

このような問題が申告された場合、弊社およびExtreme社からの最初の回答で多いのは、「各種の無線LANチューニング設定を設定していないかどうか」を細かく確認することです。もし何らかの設定をしていた場合、一旦その設定をOFFにして状況が改善するかどうか試すことをお願いします。
具体的にはバンドステアリング、高密度環境用設定、ロードバランシング、MU-MIMOなどの設定をOFFにします。

それでも解決しない場合は、再現時のログの解析や、状況によっては現地での再現を待ってパケットキャプチャーを実施し、それを解析することもあります。

上記の症状以外にも、無線LANのトラブルの原因の例としては下記のものが多い傾向にあります。

よくある無線LANのトラブル原因
トラブルイメージ

出展:Extreme社資料

弊社でもExtreme社でもトラブルの申告を受けた時に当該の事象以外に、以前からこのようなことが起きていたかどうかや類似トラブルの相談を受けていたことがないかの履歴を確認します。弊社の営業担当が代理店様やエンドユーザ様とのちょっとした会話やから深刻なトラブルとまではいかないけれど、以前に同じような相談を受けていたかどうかの記憶を手がかりに、原因究明の仮説を立てることもあります。

このようなことがヒントや突破口となり、解決できることがたまにありますが、全でのエンドユーザ様に対して、人の力で同じようなことができるかというと現実的ではありません。

3. AIの活用で問題となること

上記でお伝えしたような、「同じエンドユーザ様で起きたあらゆる履歴を手がかりに仮説を立てる」という部分を莫大なデータをもとにAI技術を活用して解決策を導くことができないか、ということが本ブログのテーマとなるのですが、このAIを使ったITの運用管理の手法やサービス提供の仕方には、ネットワーク機器メーカーによって考え方の違いがあるようです。

ご承知の通り、AI、機械学習、ビッグデータなどが身近な存在になっておおよそ10年になり、AIは天気予報や囲碁・将棋や家電製品など、さまざまなところで実用化されています。

ここで4年ほど前にたまたま観たテレビ番組のエピソードを紹介します。
NHKスペシャルの「人工知能 天使か悪魔か 2018 未来がわかる その時あなたは…」という番組で非常に衝撃を受けたエピソードです。
アメリカの病院の話で、臓器移植を待つ患者に対して、事故で脳死となった患者の移植可能な心臓を、どの患者に割り当てるかという心臓移植優先度を決める際に、移植を希望する患者のある期間における生存率と、その患者に心臓移植をした場合のある期間における生存率をAIが計算し、それらの値によってその患者に移植を認めるかどうかを決めるという映像です。
残念ながら移植が認められなかった患者が医師に理由を問うシーンで、医師からは「AIから出された数字なので理由は説明できない」ということを伝える内容でした。

「なぜそうなるかはわからないが、AIはこういう判断を下している」という結論を、重要な意思決定に利用することは非常に抵抗があります。

なぜなら業務において意思決定には常に説明責任が問われるためです。

無線LANのトラブル対応でも「〇〇のトラブルが起きるのは、〇〇の原因が疑われるため、○○の設定を〇〇に変えることで解決できるか試してみましょう」という回答でないと到底受け入れられません。
この部分についてどこまでスマートにできるかが非常に大事です。

4. Explainable AI(説明がつくAI)の重要性

「AIが言うには、〇〇のトラブルの解決には、ファームをこのバージョンに変えることです」というだけの回答にならないために、いま話題となっているキーワードがあります。

“Explainable AI” = “なぜその答えになったか説明がつくAI”

です。

Explainable AIについてはネット上にいろいろ説明が載っていますが、AIが爆発的に生活やビジネスの中に溶け込んでくる中で、そのAIの「信頼性」が重視されている証拠と言えます。
本格的にAIを活用するには、「なぜそうなるのか?」がわからないと、結果としてそれが間違いではないとしても、実務では使えないものとなるからです。

ガートナー社が提唱しているAIOPs(Artificial intelligence for IT Operations:エーアイオプス)に関するレポートの中にも「Explainability and Interpretability」という言葉が出てきます。

アクセスポイント、LANスイッチ、ルータ、ケーブル、サーバ、そしてクライアントの数や種類はますます増加し、そこから出力されるログデータ、クラウドサービスで発生している各種イベントなど、既存のIT管理者の管理能力を大幅に超えた莫大な管理データが日々生み出され蓄積されています。
表1でお伝えした6つの項目をしっかり実施したとしても、限られた運用管理でのリソースでは対応しきれないデータ量になっていることは明らかです。
これからはこの状況がますます加速されるはずです。

5. 無線LAN運用においてExplainable AIで実現出来たらうれしいこと

台風の予報のように「ある日時にある場所である端末にトラブルが起きます!」という予言を的中させることはまだまだ難しいと思われますが、

“現在の運用環境で、この部分において、何かいつもと異なる事象が起きています”

ということが判り、ユーザからもその「いつもと異なる事象」を画面で理解でき、しかもシステムから「その異常を修正できるかもしれない解決策のヒント」を提示してくれる、というのは非常に有効ではないでしょうか。

この仕組みを活用できると、ユーザからの苦情やトラブル申告を受けてからの対応ではなく、「いつもと異なる事象」を検出することで先手を打つことができるようになります。

この「いつもと異なる事象」は英語でAnomaly(アノマリー)と言います。

6. Extreme社のAIOPsへの取り組み:CoPilot(副操縦士)

Anomalyを検出するための仕組みづくりに積極的に取り組んでいるのがExtreme社です。 Extreme社はAIOPsの機能開発に積極的に投資しており、「結果について説明のつかないブラックボックス型のAI」ではなく、「なぜその答えになったか説明がつくAI」= Explainable AI を指向した最新のクラウドシステムを開発しました。

その名前はExtremeCloud™ IQ CoPilot(コパイロット)と言います。
CoPilotとは英語で“副操縦士”という意味でエンドユーザ様の運用管理担当者の補佐役となることを目指して名づけられました。

Copilotイメージ

CoPilotは、ExtremeCloud™ IQ(以後XIQ)クラウドネットワーク管理システムのオプショナルの有償ラインセス製品です。
CoPilotはクラウドライセンスのため、CoPilotを利用するためのハードウェア追加やネットワークの変更作業は一切不要です。

2021年6月にパブリックベータ版を発表し、XIQのPilotライセンス(通常の有償版ライセンス)をご利用のお客様に試験的に提供していました。
2022年9月下旬にパブリックベータ版は終了し、現在は正式ライセンスを購入して利用できる状態となっています。

このCoPilotでは下記の8つの観点でAnomaly(アノマリー)を検出し、それぞれの画面で該当する指標がどのような状態になっているかを教えてくれます。CoPilotの画面をクリックすると、Anomalyを解決するための推奨対応のメッセージも表示されます。

Explainable AIをメッセージとして全面的に打ち出しているところが大きな差別化ポイントです。

画面 検知できるAnomalyと説明している情報
WiFi Efficiency クライアントとAP間の無線通信のAnomalyを受信レート、送信レート、チャネルの挙動により検知
WiFi Capacity APのAirtime UsageのAnomaly を一斉の過剰な数のクライアント接続、高い送受信の干渉率(再送・CRCエラーの多さ)により検知
Port Efficiency LANポートの状態のAnomalyを半二重・全二重のモード変化やデータレートの頻繁な切り替わりにより検知
DFS Recurence DFSのAnomalyをDFSの検出によるチャネル変更の頻度により検知
Adverse Traffic Patterns 異常なトラフィックパターンのAnomalyをマルチキャストやブロードキャストの送受信トラフィック量がAPのCPU利用率に及ぼすインパクトにより検知
Wireless Connectivity Experience 無線LAN接続の快適さのAnomalyを場所・SSID・クライアントタイプごとの接続(アソシエーション、認証)に要する時間により検知
PoE Stability PoEのAnomalyをAPへの給電状況(電力の低下、PoEとPoE+の頻繁な切り替わり)により検知
Wired Connectivity Experience 有線接続の快適さのAnomalyを場所ごとのLANスイッチのポートのエラーにより検知

7. Extreme Cloud IQ CoPilotの実際の活用事例

CoPilotのパブリックベータ版でCoPilotのAnomaly情報を活用してトラブルを解決できたお客様の事例を紹介します。

前提

昨年Extreme社のAPを導入いただき、表1の「無線LANの安定運用のベストプラクティス」の内容をほぼ実施し、安定的に運用ができていました。

現象

ある事務所でWEB会議システムを利用している際に通信の遅延が報告され、無線LAN利用が不安定になっているとの申告を利用者様からいただきました。
CoPilotの画面を見てみるとWi-Fi Capacityの画面にAnomalyが検出され、

XXX is nearing its wireless capacity on channel 48 in 5 GHz due to high airtime utillization by few clients.

数台のクライアントの過剰なAirtimeによって、あるAPの5GHzの48番チャネルのキャパシティの上限に近づいています。

ということが表示されていました。

UIイメージ

CoPilotからの推奨アクションは下記となっていました。

A low number of clients is causing high airtime utillization Check your data rate configurations and consider enabling probe request suppresssion to prevent clients with low SNR from connecting to this AP.

数台のクライアントが高いAirtimeの原因となっています。データレートの設定をチェックして、プローブ要求の抑制を有効にして、SNR の低いクライアントがこの AP に接続しないようにすることを考慮してください。

対応

弊社サポートチームと代理店様との協議により、特定APの高いAirtimeを解消するために、下記の2つの対策を講じました。

  1. APと端末間のデータレート値を高いものに設定する
  2. ラジオプロファイルの「弱い信号プローブ要求抑制」設定をONにして、端末のローミングが積極的に実行されるように促す
UIイメージ

結果

この設定を当該事務所のAPに実装したところ、トラブル報告はなくなり、問題は解決しました。しばらくの様子見のあと、他の拠点にも同じ設定を実施して現状では同じ問題は起きていません。

効果

もともと安定的に運用できていたお客様であったため、毎日XIQを確認しているわけではありませんでした。
お客様からのトラブルの申告後すぐにXIQの各種画面とベータ版のCoPilot画面を見て、ここからの情報を対応の方針決定に役立てることができたため、CoPilotが今回の問題解決に大いに役立ったと評価していただきました。

8. まとめ

これらのことをまとめると、無線LANの安定運用にはまずは表1の「無線LANの安定運用のベストプラクティス」にある6項目を実践することが非常に重要と考えます。

その次の段階に進むための「新技術の採用」として、Explainable AIを目指すXIQ CoPilotをご導入いただくのが最も効果的です。
この下記の表2の7項目を総合的に実施いただくことこそが次世代型の無線LANの安定運用のベストプラクティスと言えます。

次世代型の無線LANの安定運用のベストプラクティス(表2)
   
安定運用の要素 テーマ 内容
システムデザイン 製品選定
  • 究極にシンプルで障害ポイントのないシステム構成を実現できる製品を採用する
導入時の設計
  • 全拠点共通な設定情報に調整する
  • デフォルト設定(チューニング設定しない)最優先
  • 慎重にファームウェアを選定する
  • Syslogサーバを設定する
運用体制の充実度 導入直後の微調整
  • データやログによる前システムと比較検証を実施し安定運用ができることの確認をする
定期メンテナンス
  • 計画的にファームウェアを選定しアップグレードする
トラブル発生時の切り分けと解決方法
  • 切り分けのための環境面の情報収集
  • データに基づく原因究明のための基盤を整備する
  • Techデータのタイムリーな取得と解析
  • Syslogサーバのログの解析
拡張や移転などの変更対応
  • 導入時の設計内容に基づき、個別対応しない
  • 本社移転やM&Aなどの大きなイベントには、元の設計内容を再検討する
新技術の採用 AIOPsの活用 上記を実践した上で、いつもと異なる事象=Anomalyに基づく先回りをした運用管理を実施する

いかがでしたでしょうか?
無線LANの安定運用にお悩みの方、下記の項目にひとつでも当てはまるという方には、このブログの内容についての意見交換や詳しいご説明ができればと考えています。

  • 日常的にXIQを確認しつつ運用管理を行っている方
  • パブリックベータ版の利用中、実際にご利用&トラブル解決に役立てた経験のある方
  • これからAIOPsの導入を検討されている方
  • 当ブログのベストプラクティスにご興味のある方
  • ネットワーク管理におけるExplainable AIにご興味のある方
  • 非常に多くのAP、接続端末の管理に日々苦労されている方
  • 無線LANの管理を熟練管理者から通常のスキルの管理者に移管していきたい方
  • 本社移転やM&Aなどで従来の無線LAN環境の前提に大きな変更が予定されている方
  • 無線LAN製品の導入やリプレースをご検討中の方

Sanko IBでは10年以上に渡り培ってきた無線LANの知見やノウハウがあります。無線LANでお困りのことがありましたら、お気軽にご連絡いただけたらと思います。

当ブログの記事をまとめた資料をご用意しておりますので、ご希望の方は、下記よりダウンロードください。

資料サムネイル
無線LANのさらなる活用に向けて(後編)
AIを活用したIT運用(AIOPs)と頼れる「副操縦士」
ダウンロードする 
関連情報

 

お役立ち情報一覧 

 

PAGE TOP