]> git.uio.no Git - check_openmanage.git/blob - CHANGES
3.5.5
[check_openmanage.git] / CHANGES
1 3.5.5   2010-01-22
2 ------------------
3
4 * Fixed an SNMP bug where the plugin didn't handle OID indexes that
5   were not sequential. Thanks to Gianluca Varenni for reporting.
6 * Fixed an SNMP bug when checking old hardware such as the PE 2650 and
7   PE 750. The controller id for physical drives were collected and
8   displayed incorrectly. This release uses an additional OID to fetch
9   this info, which would otherwise be unavailable. Thanks to Gianluca
10   Varenni for reporting this bug.
11 * Should use %snmp_probestatus, not %snmp_status when checking the
12   status of voltage probes. Thanks to Ken McKinlay for a patch.
13 * Fix when identifying blades via SNMP with very old OMSA
14   versions. Patch from Ken McKinlay.
15 * Better way of finding the ID of physical drives via SNMP
16
17
18 3.5.4   2010-01-13
19 ------------------
20
21 * Added support for storport driver version for controllers, only
22   applicable on servers running Windows.  A new blacklisting keyword
23   for suppressing storport driver messages was added.
24 * The "all" keyword in blacklisting is now case insensitive.
25 * More fine-grained reporting in the rare case where a controller
26   battery fails during learning and charging states.
27 * New improved way of reporting perl warnings during execution of the
28   plugin.
29
30
31 3.5.3   2009-12-17
32 ------------------
33
34 * Fix for path to omreport on Linux with OMSA 6.2.0
35 * A couple of other small fixes
36
37
38 3.5.2   2009-11-17
39 ------------------
40
41 * Fix for undefined device name for logical drives (thanks to Pontus
42   Fuchs for a patch)
43 * Fixed a bug in the PNP4Nagios template, that prevented the template
44   from working with PNP4Nagios 0.6. Thanks to the PNP4Nagios team for
45   the fix.
46 * Other small fixes
47
48 3.5.1   2009-10-22
49 ------------------
50
51 * CPU type, family etc. are now reported in case of a CPU failure (and
52   in the debug output)
53 * The debug output now reports Openmanage version and plugin version
54
55
56 3.5.0   2009-10-13
57 ------------------
58
59 * New option '-a' or '--all' turns on checking of everything
60 * The manual page (POD info) is removed from the script and is now in
61   a separate file, to make check_openmanage fully ePN compatible
62 * ePN is no longer disabled by default, check_openmanage no longer has
63   an opinion on whether it should run under ePN or not
64 * The '-m' or '--man' option is no longer available
65 * The option '-v' or '--verbose' is renamed to '-d' or '--debug',
66   which makes more sense wrt. its usage
67 * The '-g' or '--global' option is removed. Checking the global health
68   status is now default if applicable
69 * Checking intrusion detection is now turned on by default
70 * The obsolete option '--snmp' is removed
71 * The option '--state' now has a shorter equivalent '-s'
72 * The basename stuff and options '--only-critical' and
73   '--only-warning' are now replaced by an option '--only'
74 * If plugin is run by Nagios, redirect stderr to stdout
75 * Added option '--omreport', that lets the user specify the full path
76   to the omreport binary
77 * Added non-8bit-legacy default search paths for omreport.exe for
78   Windows boxen
79 * Minor changes to the plugin output, for consistency
80 * New blacklisting keyword 'bat_charge' disables warning messages
81   related to controller cache battery charging. Thanks to Robert
82   Heinzmann for a patch.
83 * For blacklisting, the component ID kan now be "ALL", in which all
84   components of that type is blacklisted.
85 * Man page is moved to manual section 8
86
87
88 3.4.9   2009-08-07
89 ------------------
90
91 * Fixed a bug that could cause errors and weird results when checking
92   cooling devices (fans) via SNMP. Thanks to Ken McKinlay for spotting
93   this bug and reporting it.
94
95 3.4.8   2009-07-31
96 ------------------
97
98 * For failed physical drives, check_openmanage will now output the
99   drive's vendor, model and size in GB or TB.
100
101 3.4.7   2009-07-24
102 ------------------
103
104 * The -s|--snmp option was redundant and no longer does anything. SNMP
105   is triggered automatically if the -H|--hostname option is
106   present. The -s|--snmp option is kept for compatibility, but has no
107   effect.
108
109 3.4.6   2009-07-07
110 ------------------
111
112 * Added support for performance data (temperatures) from attached
113   storage enclosures such as the MD1000
114
115 3.4.5   2009-06-22
116 ------------------
117
118 * Fixed a regression in the --htmlinfo option when it is not supplied
119   with an argument
120
121 3.4.4   2009-06-22
122 ------------------
123
124 * New option --htmlinfo adds clickable HTML links in the plugin's
125   output
126
127 3.4.3   2009-06-11
128 ------------------
129
130 * Fixed a regression bug in CPU and power supply reporting that only
131   affects verbose output
132 * If blacklisting is used, the global health check (via the --global
133   option) is now negated. Checking the global health doesn't make
134   sense when one or more components is blacklisted. Thanks to Rene
135   Beaulieu for reporting this bug
136 * The PNP4Nagios template is now included in the tarball and zip
137   archive
138
139 3.4.2   2009-06-03
140 ------------------
141
142 * Improved memory error reporting, when using omreport
143 * Collect performance data from pwrmonitoring (amperage probes) that
144   were previously ignored when using omreport
145
146 3.4.1   2009-05-25
147 ------------------
148
149 * Improved memory error reporting, when using SNMP
150 * Other small ehnancements
151
152 3.4.0   2009-05-25
153 ------------------
154
155 * The plugin is now compatible with the Nagios embedded Perl
156   interpreter (ePN) in theory. However, the plugin will not not use
157   ePN by default. We don't want any "accidents".
158 * License is now GPLv3, previously only specified as "GPL"
159 * New options --only-critical and --only-warning. With these options
160   the plugin will only print critical or warning alerts, respectively.
161 * Bugfixes and speed enhancements in the storage section, when
162   checking enclosure components via omreport
163 * The --okinfo option is now less verbose and more to the point
164 * Lots of code refactoring for readability, maintainability and
165   robustness
166
167 3.3.2   2009-05-05
168 ------------------
169
170 * Fixed a bug in the storage section, when checking controllers. This
171   is an obscure bug that only manifests itself in the odd case where a
172   server has multiple controllers, and one of the controllers are
173   missing some of the OIDs, in which case these OIDs will be missing
174   for the other controllers as well. The change is minor and only
175   includes using get_table() instead of get_entries() to collect the
176   SNMP result. Thanks to Stephan Bovet for reporting this bug.
177
178 3.3.1   2009-04-28
179 ------------------
180
181 * The --perfdata option can now optionally take an argument
182   "multiline", which makes the plugin produce multiline performance
183   data output in a Nagios 3.x way. Not really needed, but the plugin
184   output is prettier.
185 * Added comment within the 10 first lines to disable the nagios
186   embedded perl (ePN) interpreter by default for Nagios 3.x
187 * Improvements in the performance data output. Units are now included
188
189 3.3.0   2009-04-07
190 ------------------
191
192 * Added --global option, which turns on checking of everything. If
193   used with SNMP, the global system health status is also probed, to
194   protect the user against bugs in the plugin. If used with omreport,
195   the overall chassis health is used.
196 * Support for SNMP version 3
197 * New check added: esmhealth. This checks the overall health of the
198   ESM log, i.e. the fill grade. More than 80% means a warning message
199 * Fixed alert log reporting to use the same format as for the ESM log
200 * Output messages are now sorted by severity
201 * Minor changes in how out-of-date controller firmware/driver is
202   reported
203 * Code refactoring and cleanup
204
205 3.2.7   2009-03-29
206 ------------------
207
208 * Use "omreport about" to collect OMSA version. Slightly faster than
209   "omreport system version". This should give a small speedup in
210   certain configurations
211 * Fixed typo in output when a logical drive is rebuilding. Thanks to
212   Andreas Olsson for reporting
213 * Improved reporting of ESM log content
214 * Added omreport.sh as alternate omreport path
215 * Lots of other small fixes and enhancements
216
217 Plus: A few changes to make the plugin work with old PowerEdge models
218 (e.g. 2550, 2450) and/or old OMSA versions (e.g. version 4.5):
219
220 * Use the chassisModelName OID to determine if SNMP works (instead of
221   BaseboardType)
222 * No longer require a response when checking baseboard type via
223   SNMP. If there is no response, we assume that we're not dealing with
224   a blade server
225
226 Thanks to Christian McHugh for help with testing and debugging this
227 stuff
228
229 3.2.6   2009-03-05
230 ------------------
231
232 * Use 'omreport system operatingsystem' to collect OS info, instead of
233   'omreport system' version which is incredibly slow. This should speed
234   things up in certain configurations.
235 * A few speedups, don't collect information that isn't needed
236 * Man page fixes
237
238 3.2.5   2009-02-24
239 ------------------
240
241 * New option --linebreak to specify the separator between line in case
242   of multiline output
243 * Added support for 64bit Windows. Thanks to Patrick Hemmen for a patch
244 * [Patrick Hemmen] Added install.bat for Windows installation
245 * [Patrick Hemmen] Improvements on install.sh. Will now install in
246   /usr/lib64 for x86_64
247 * RPMs are now architecture dependent, because of different libdir
248
249 3.2.4   2009-02-17
250 ------------------
251
252 * New option -o|--ok-info to display extra information when everything
253   is ok. The plugin can now display storage firmware and driver info,
254   DRAC and BMC firmware, and OMSA version
255 * Support for setting custom minimum temperature thresholds via the
256   -c|--critical and -w|--warning options
257 * Better and more detailed temperature error reporting
258 * Bugfix in the amperage report (including performance data). The
259   plugin now takes into account the correct unit and measurement for
260   amperage probes (other than watts)
261 * New option --port lets the user specify the remote SNMP port number
262
263 3.2.3   2009-02-09
264 ------------------
265
266 * Regression fix: Use the older Processor Device SNMP OIDs for older
267   PowerEdge models, that don't have the new Processor Device Status
268   OIDs. Thanks to Nicole Hähnel for reporting this bug.
269 * Default output (when there are no alerts) now shows RAC firmware,
270   BMC firmware, info about controllers and enclosures (firmware,
271   driver).
272
273 3.2.2   2009-02-03
274 ------------------
275
276 * Regression fix: Ignore unoccupied CPU slots with SNMP probing. This
277   fixes a bug introduced in versjon 3.2.1, which would output
278   something like this if one or more CPU slots were empty: CPU 1 needs
279   attention ()
280
281 3.2.1   2009-02-03
282 ------------------
283
284 * Use Processor Device Status Table OIDs instead of Processor Device
285   Table when checking CPUs via SNMP
286 * Bugfix: don't report throttled CPUs as warnings when checking via
287   SNMP (same as for checking locally)
288
289 3.2.0   2009-01-27
290 ------------------
291
292 * New options --state and --short-state for displaying service state
293   along with the alert
294 * Lots of small fixes for code readability and maintainability
295
296 3.1.1   2009-01-12
297 ------------------
298
299 * Support for running natively on Windows (using omreport.exe). Thanks
300   to Peter Jestico for a patch.
301 * Support for compiled Windows version, i.e. check_openmanage.exe is
302   now a legal script name.
303 * Exit with error if script basename is illegal/unknown
304 * Various small fixes
305
306 3.1.0   2008-12-26
307 ------------------
308
309 * Use of alternate basenames for checking only one class of components
310 * Added support for checking the ESM log via SNMP
311 * Code refactoring for robustness and maintainability
312 * Numerous small fixes and enhancements
313 * Added install script in distribution tarball
314
315 3.0.2   2008-12-20
316 ------------------
317
318 * The script no longer aborts if it can't get system information via
319   SNMP. Give a warning instead, as this is not a critical error
320 * Increased robustness when checking controllers
321
322 3.0.1   2008-12-11
323 ------------------
324
325 * Man page fix in the 'check' section. Thanks to Ansgar Dahlen for
326   reporting this.
327 * Allow invalid command error from 'omreport chassis pwrmonitoring'
328 * Various small fixes
329
330 3.0.0   2008-12-04
331 ------------------
332
333 * Use unique IDs for storage components with regard to blacklisting,
334   which means that the blacklisting API has changed
335 * Added checks for storage components: connectors (channels),
336   enclosures, enclosure fans, enclosure power supplies, enclosure
337   temperature probes and enclosure management modules (EMMs)
338 * Improved verbose output
339 * New option -t|--timeout for setting the plugin timeout
340 * New option -w|--warning for setting custom temperature warning
341   thresholds
342 * New option -c|--critical for setting custom temperature critical
343   thresholds
344 * Option --check can no longer be specified in its short form (-c)
345 * Code cleanup and improvements
346
347 2.1.1   2008-11-24
348 ------------------
349
350 * The workaround for the OMSA bug introduced in OMSA 5.5.0 didn't take
351   multiple controllers into account. This has been fixed.
352
353 2.1.0   2008-11-19
354 ------------------
355
356 * New option -i|--info prefixes all alerts with the service tag
357 * New option -e|--extinfo gives and extra line of output in case of an
358   alert (model and service tag)
359 * New option --postmsg lets the user specify a post message string,
360   with info such as model, service tag etc.
361 * Options -b|--blacklist and -c|--check can now be specified multiple
362   times (actually quite useful)
363
364 2.0.9   2008-11-17
365 ------------------
366
367 * Slightly improved output for alerts on logical drives (vdisks)
368 * Now shows a rebuilding physical disk as a warning, as this is
369   usually accompanied by a degraded vdisk. Previous versions didn't
370   show this at all (omreport classifies it as "OK").
371
372 2.0.8   2008-11-14
373 ------------------
374
375 * Slightly improved output for charging controller batteries
376
377 2.0.7   2008-11-12
378 ------------------
379
380 * Bugfix for reporting physical drives with predictive failure (both
381   via NRPE and SNMP)
382
383 2.0.6   2008-10-30
384 ------------------
385
386 * Fix bug in option handling (ambiguous options)
387 * Slightly improved output if checking the storage subsystem is turned
388   off
389 * Don't complain if there are no logical drives. This is OK. Thanks to
390   Jamie Henderson for reporting this
391
392 2.0.5   2008-10-29
393 ------------------
394
395 * Fix bug in SNMP status level table
396
397 2.0.4   2008-10-29
398 ------------------
399
400 * Added workaround for a BUG introduced in OpenManage 5.5.0. OM
401   sometimes adds a newline in the controller driver version name,
402   which leads to problems parsing the output. Thanks to Hiren Patel
403   for bringing this to my attention.
404
405 2.0.3   2008-10-28
406 ------------------
407
408 * (snmp) Improved handling of cases where OM is not working properly
409
410 2.0.2   2008-10-27
411 ------------------
412
413 * Fixed issue where controller number for physical disks can't be
414   established via SNMP (now identifies as controller no. -1)
415
416 2.0.1   2008-10-23
417 ------------------
418
419 * Correctly identifies and reports error condition in which OpenManage
420   has stopped working (it happens)
421
422 2.0.0   2008-10-23
423 ------------------
424
425 * SNMP support
426 * Same options for checking, blacklisting etc. supported with SNMP
427 * Same output with SNMP as with NRPE
428
429 1.2.1   2008-09-25
430 ------------------
431
432 * Collects performance data if the option '-p' or '--perfdata' is
433   supplied.
434 * New blacklisting directives ctrl_fw and ctrl_driver
435   added. Suppresses the "special" warning messages concerning outdated
436   controller firmware and driver. Useful if you can't or won't
437   upgrade.
438
439 1.1.2   2008-08-06
440 ------------------
441
442 * Fix getting system model and serial number for newer blades
443
444 1.1.1   2008-08-06
445 ------------------
446
447 * Three new checks added:
448   - System battery probes (typical CMOS battery). Newer poweredge
449     models have these
450   - Power consumption monitoring (if the server supports it)
451   - ESM log, with same functionality as the alert log check. Disabled
452     by default.
453
454 1.1.0   2008-08-04
455 ------------------
456
457 * Internal refactoring: use ssv-formatted output from openmanage,
458   resulting in slightly faster execution and increased robustness.
459 * If /usr/bin/omreport doesn't exist, try
460   /opt/dell/srvadmin/oma/bin/omreport.
461 * Allow for no instrumented/redundant power supplies. Needed on
462   low-end poweredge models and blades.
463
464 1.0.3   2008-07-25
465 ------------------
466
467 * Openmanage reports non-critical warning about throttled CPUs on new
468   hardware models. Most og us use ondemand CPU frequency scaling (with
469   throttled CPUs as a result). This specific non-critical warning (CPU
470   Throttled) is ignored from now on.
471 * Remove superfluous Celcius sign when reporting temperatures.
472
473 1.0.2   2008-07-25
474 ------------------
475
476 * Accommodate blade systems with no fans or powersupplies, i.e. accept
477   errors from omreport when trying to check fans or powersupplies on
478   blade servers.
479 * Accommodate newer hardware with slightly different omreport
480   options. Use the newer options if they exist. Not really necessary
481   yet, but deprecated options may be removed in future versions of
482   Dell OpenManage.
483
484 1.0.1   2008-07-18
485 ------------------
486
487 * When everything is OK, check_openmanage now outputs the same info as
488   Gerhard Lausser's excellent check_hpasm plugin does for HP servers:
489
490   OK - System: 'poweredge 2850', S/N: 'XXXXXXX', ROM: 'A06
491   10/03/2006', hardware working fine, 2 logical drives, 4 physical
492   drives
493
494 1.0.0   2008-07-15
495 ------------------
496
497 * Initial release