使用進階監控設施

學習內容
使用進階監控機制 模組
繼續使用本課程教材即表示您已同意這些條款與條件。Interskill Learning Pty. Ltd. © 2024
學習檢核
- 能用自己的話說明「使用進階監控設施」在本 topic 中的用途。
- 能把本頁概念連回日常 z/OS system activity 監控情境。

使用進階監控機制 模組
繼續使用本課程教材即表示您已同意這些條款與條件。Interskill Learning Pty. Ltd. © 2024

使用進階監控機制的目標
已開發多種監控機制以便監控 z/OS 系統。
在本模組中,您將探索其中一些機制及其用途。
在本模組結束時,您應該能夠:

Resource Measurement Facility (RMF) 是 z/OS 的選用元件,用來收集、分析並報告系統的效能。RMF 可執行下列功能(含其他項目):

「session」一詞用來表示 RMF 的一段執行期間。可執行三種不同類型的工作階段:

Monitor I 工作階段用來報告跨越較長期間的活動。它量測各種系統資料,這些資料可用於需要彙總數週或數月內蒐集資訊的活動(例如容量規劃)。
Monitor I、Monitor II 與 Monitor III,以及 RMF Postprocessor,都可用來產生報告。

Monitor II 能擷取與單一位址空間及資源使用(例如處理器、DASD 磁碟卷與儲存)相關的效能活動快照。產生的報表可透過線上顯示工作階段或透過 Monitor II 背景工作階段進行存取。
Monitor II 也可用來持續監控個別作業或磁碟卷。

Monitor III 會話用於檢查使用者或作業的效能、它們的執行速度(工作流程)以及過程中遇到的任何延遲。
Monitor III 會話可用於在資源短缺發生後數分鐘或數小時內識別它們。

您可以使用 RMF Monitor III 會話持續監控系統、單一作業或一組作業,以解決效能問題。
Monitor III 的資料可利用本模組稍後討論的多個產品線上上顯示,或以多種不同格式列印。

RMF 3.1 Delay 報表,第1行,共58行
透過 RMF Monitor I、II 與 III 的會話,可以取得多種類型活動的資訊,包括 CPU、位址空間、通道路徑、I/O 裝置、I/O 佇列、分頁、enqueue、實體儲存、工作流程及延遲活動。

區間報告 – 顯示每個已蒐集資料的區間之 sysplex 效能。期間報告 – 包含在較長期間彙總的資料。彙總、例外與總覽報告 – 讓您建立管理系統效能所需的報告。總覽紀錄 – 這些可匯入工作站試算表。網頁瀏覽器資料 – 以 XML 格式建立的報告,可透過網頁瀏覽器顯示。
RMF 資料可以以 System Management Facility (SMF) 紀錄的形式儲存,然後可作為稱為 RMF Postprocessor 的程式的輸入。該程式會以多種格式產生資訊,包括傳統報表。
將滑鼠移到 RMF Postprocessor 的輸出上方以顯示該項目的描述。

如果您在透過 sysplex 組態將多個系統連結的環境中工作,則可能會在每一部系統上執行 RMF Sysplex Data Server。這些分散式的 RMF 系統能夠彼此通訊並共享資訊,因此無論您連線到哪一部系統,都能要求整個系統範圍的效能資料。

應用程式可以透過 RMF Distributed Data Server (DDS) 擷取整個 sysplex 的 RMF 資料。在此過程中,應用程式會向 RMF DDS 傳送 HTTP 請求,RMF DDS 隨後會從執行於 sysplex 成員上的 RMF 實例收集所需資訊。然後,RMF DDS 以 XML 文件的形式將回應傳回給應用程式。

RMF 也提供一個選用的資源監控工具 RMF XP Distributed Data Server,可讓您監控其他系統(例如 Linux on Z 與 AIX on POWER 系統)的效能。
在這些情境中,RMF XP 還需要 Common Information Model (CIM) 伺服器、RMF CIM Client,以及 RMF Distributed Data Server。

RMF 也具備試算表報表功能,可將您所要求的後處理程式資訊以圖表形式顯示。此功能並提供多種報表範本,協助您將效能資料呈現得更具意義。

有數種監控工具與應用程式,可使用工作站來監控 RMF 資料:
z/OSMF 是一個管理主控台,除了其他功能外,可存取大部分 RMF Monitor III 的資訊,並可儲存此資料的自訂檢視。RMF Performance Monitoring (RMF PM) 從 RMF Distributed Data Server (DDS) 取得可用的 RMF 資料。它允許您定義基於情境的範本,稱為 PerfDesks;每當開啟時,PerfDesks 會依據效能監控需求取得 RMF 資料。先前建立且以 XML 格式儲存的 Postprocessor 報表,可以下載到您的工作站,並使用 RMF XSL 樣式表在瀏覽器中顯示。

摘要:使用進階監控機制
已開發多種監控機制,以便監控 z/OS 系統。
在本模組中,您已探索其中一些機制及其用途。
您現在應該能夠:

追蹤系統事件可提供對問題診斷有價值的資訊。
z/OS 下有數種追蹤類型,且像 JES2 與 VTAM 等元件各自具有其追蹤機制。
本節將概述下列追蹤:Master Trace、System Trace、GTF Trace、Component Trace 與 Transaction Trace。

Master Trace 記錄控制台的流量,例如訊息、操作員指令與系統回應。
資訊會寫入 Master Trace 表,該表是一段保存在主排程器位址空間的儲存區,可包含在傾印中,為診斷問題的人員提供額外的問題識別與排除資料。
當訊息寫入控制台時,也會同時寫入 Master Trace 表。一旦到達表尾,紀錄會從表頭重新寫入。
按一下 Play 以觀看 Master Trace 的動畫。

Master Trace 通常會在 IPL 期間自動啟動,但也可以手動切換:

System Trace 是作業系統的一部分,用來記錄在 z/OS 初始化與執行期間發生的系統事件。在系統初始化期間,System Trace 會自動啟動,而且像 Master Trace 一樣,記錄會寫入其內的追蹤表。
預設情況下,System Trace 會在所有傾印情況中被擷取;例外為 SNAP dump,此情況可加入額外的系統參數以提供此功能。
按一下 Play 以檢視 System Trace 所收集的一些資訊類型。

由於 Master Trace 和 System Trace 通常會持續執行,當發生記憶體傾印時,這兩者對診斷意外問題非常有用。
請注意,可使用 TRACE ST,BR 指令來控制分支追蹤。此功能預設未啟用,因為它可能會消耗大量儲存並可能影響系統效能,因此應僅依指示使用。

另一個您可能會覺得有用的追蹤是 Generalized Trace Facility (GTF),它會記錄與 System Trace 類似的資訊,但可以自訂只追蹤特定事件,並將結果寫入資料集(通常命名為 SYS1.TRACE)或寫入追蹤表。
因此,如果您遇到問題,可以使用 GTF 選取一或兩個您認為可能指出問題來源的事件。
按一下 Play 以檢視 GTF Trace 可指定的不同事件。

作為操作員,系統程式設計師可能會請你執行此類追蹤。GTF Trace 是一個 started task,可使用 START GTF 主控台命令啟動,但該主控台必須具有 master 授權。
用來定義要記錄事件類型的參數,可在主控台輸入,或從邏輯 parmlib 的成員參考——通常為 GTFPARM。
可使用 STOP GTF 主控台命令隨時停止 GTF Trace。
按 Play 可以檢視 GTF Trace 的範例。

另一種您可能會遇到的追蹤是 Component Trace,通常用來收集特定 MVS 元件的追蹤資料。它經常在重現問題時使用,所得資料會由廠商支援人員用來診斷元件問題並識別元件的執行方式。
操作員會使用 TRACE CT 來啟動與停止追蹤,並且可以在指令中提供追蹤參數,或讓系統提示操作員輸入這些資訊。
點選 Play 可觀看示範。

Transaction Trace 能擷取在多系統應用程式環境中執行的工作單元相關之關鍵事件資訊。例如,存取遠端 IMS 子系統中 IMS 資料庫的 IMS 交易。所蒐集的資料會顯示用來處理該交易之各元件之間的工作流程。
TRACE TT 操作員指令可用來啟動與停止 Transaction Trace,並提供要追蹤之交易的篩選細節。
按一下 Play 以檢視示範。

D TRACE
輸入 DISPLAY TRACE 指令即可顯示追蹤的狀態與生效參數。
將滑鼠移到畫面內容上,即可顯示該資料的說明。

從 z/OS 初始化時起直到關機為止,描述硬體錯誤及選定軟體錯誤的記錄會寫入 LOGREC 資料集,或寫入整個 sysplex 的 LOGREC 日誌串流。
由於所有錯誤都記錄在 LOGREC,因此可以擷取系統錯誤的完整歷史記錄。
這些資訊可用於分析並識別 z/OS 系統內的問題。

LOGREC 資料集
上圖說明了如何使用 LOGREC 資料集來記錄並處理 LOGREC 資訊。
將滑鼠移到箭頭上方以顯示每個元素的說明。

預設情況下,LOGREC 資料集的名稱為 SYS1.LOGREC。
可以在系統參數清單 (IEASYSxx) 中指定 LOGREC 參數,以使用不同的資料集名稱。
如果未指定 LOGREC 參數,將使用名稱 SYS1.LOGREC。

SYS1.LOGREC 資料集的情境適用於系統數量有限且不屬於 sysplex 的組織。在此情況下,每個系統都需要各自的 SYS1.LOGREC 資料集。
對於在 sysplex 中有多個系統的環境,可以將記錄設定為在 coupling facility 上的 log stream,從而更容易管理這些資訊。

模組測驗:使用進階監控機制
您即將進入一個計分測驗,成績可能會記錄以供日後參考。
請完成以下頁面上的問題。

模組完成 — 使用進階監控功能
您可以按一下 Exit 離開「使用進階監控功能」並記錄您的結果,或使用 目錄 返回並檢視本模組。
若要再次參加「使用進階監控功能」模組測驗,您需要先離開模組,然後從您的 LMS 重新參加測驗。
注意:為確保您的結果能正確儲存,請使用位於此訓練視窗右上角的 「Exit」 按鈕。請勿使用瀏覽器右上角的 'X'。
本模組的練習測驗與 Module Test 題目已納入「練習與評量」,可依題型或來源篩選練習。本站以非計分模式提供 11 題練習;正式分數、attempt、completion 與憑證仍以 YourLearnings / InterSkill 為準。