]> git.uio.no Git - check_openmanage.git/blob - CHANGES
jau
[check_openmanage.git] / CHANGES
1 3.5.7   
2 ------------------
3
4 * Added robustness for received SNMP values that are not defined in
5   the MIB. Instead of throwing a perl warning when this happens, the
6   plugin will not report the undefined value.
7 * Defined "Replacing" as a defined state for physical disks in SNMP
8   mode, even though this state is not defined in the MIB. It is
9   reported as such by omreport.
10 * Physical disk brand/model is now reported when the state of the disk
11   is "Rebuilding" or "Replacing".
12 * The state of a physical disk is reported in parentheses when the
13   predictive failure is detected. It is useful to know if a disk is
14   online, offline, spare or even failed when predictive failure is
15   reported.
16 * Handling of physical disk predictive failure has been improved
17   overall.
18 * Refactoring of the perfdata code. In conformance with the plugin
19   development guidelines, the UOM (unit of measure) previously
20   reported in the perfdata output has been removed.
21 * The -p or --perfdata option now
22   takes an optional agrument 'minimal', which triggers shorter names
23   for the perfomance data labels. This shortens the output and is a
24   workaround for systems where the amount of output exceeds the 1024
25   char limit of NRPE.
26 * The PNP4Nagios template has been updated. Users of check_openmanage
27   and PNP4Nagios are advised to upgrade. This version of
28   check_openmanage needs the new template.
29 * Lots of small improvements.
30
31
32 3.5.6   2010-02-23
33 ------------------
34
35 * New option '--use-get_table' is added as a workaround for SNMPv3 on
36   Windows using net-snmp. This option will make check_openmanage use
37   the Net::SNMP function get_table() instead of get_entries() to
38   collect information via SNMP.
39 * Include a blacklisting option 'ctrl_pdisk' which takes the
40   controller number as argument. This blacklisting option only works
41   with omreport and is a workaround for broken disk firmwares that
42   contain illegal XML characters. These characters makes openmanage
43   barf and exit with an error. Patch from Bas Couwenberg.
44 * If the blacklisting keyword "all" is supplied for a component type,
45   that component type is not checked at all, i.e. the commands are
46   never executed. This will make check_openmanage execute faster if
47   blacklisting is heavily used.
48 * Option '--htmlinfo' now has a shorter equivalent '-I'
49 * The option '--short-state' now has a shorter equivalent '-S'
50
51
52 3.5.5   2010-01-22
53 ------------------
54
55 * Fixed an SNMP bug where the plugin didn't handle OID indexes that
56   were not sequential. Thanks to Gianluca Varenni for reporting.
57 * Fixed an SNMP bug when checking old hardware such as the PE 2650 and
58   PE 750. The controller id for physical drives were collected and
59   displayed incorrectly. This release uses an additional OID to fetch
60   this info, which would otherwise be unavailable. Thanks to Gianluca
61   Varenni for reporting this bug.
62 * Should use %snmp_probestatus, not %snmp_status when checking the
63   status of voltage probes. Thanks to Ken McKinlay for a patch.
64 * Fix when identifying blades via SNMP with very old OMSA
65   versions. Patch from Ken McKinlay.
66 * Better way of finding the ID of physical drives via SNMP
67
68
69 3.5.4   2010-01-13
70 ------------------
71
72 * Added support for storport driver version for controllers, only
73   applicable on servers running Windows.  A new blacklisting keyword
74   for suppressing storport driver messages was added.
75 * The "all" keyword in blacklisting is now case insensitive.
76 * More fine-grained reporting in the rare case where a controller
77   battery fails during learning and charging states.
78 * New improved way of reporting perl warnings during execution of the
79   plugin.
80
81
82 3.5.3   2009-12-17
83 ------------------
84
85 * Fix for path to omreport on Linux with OMSA 6.2.0
86 * A couple of other small fixes
87
88
89 3.5.2   2009-11-17
90 ------------------
91
92 * Fix for undefined device name for logical drives (thanks to Pontus
93   Fuchs for a patch)
94 * Fixed a bug in the PNP4Nagios template, that prevented the template
95   from working with PNP4Nagios 0.6. Thanks to the PNP4Nagios team for
96   the fix.
97 * Other small fixes
98
99 3.5.1   2009-10-22
100 ------------------
101
102 * CPU type, family etc. are now reported in case of a CPU failure (and
103   in the debug output)
104 * The debug output now reports Openmanage version and plugin version
105
106
107 3.5.0   2009-10-13
108 ------------------
109
110 * New option '-a' or '--all' turns on checking of everything
111 * The manual page (POD info) is removed from the script and is now in
112   a separate file, to make check_openmanage fully ePN compatible
113 * ePN is no longer disabled by default, check_openmanage no longer has
114   an opinion on whether it should run under ePN or not
115 * The '-m' or '--man' option is no longer available
116 * The option '-v' or '--verbose' is renamed to '-d' or '--debug',
117   which makes more sense wrt. its usage
118 * The '-g' or '--global' option is removed. Checking the global health
119   status is now default if applicable
120 * Checking intrusion detection is now turned on by default
121 * The obsolete option '--snmp' is removed
122 * The option '--state' now has a shorter equivalent '-s'
123 * The basename stuff and options '--only-critical' and
124   '--only-warning' are now replaced by an option '--only'
125 * If plugin is run by Nagios, redirect stderr to stdout
126 * Added option '--omreport', that lets the user specify the full path
127   to the omreport binary
128 * Added non-8bit-legacy default search paths for omreport.exe for
129   Windows boxen
130 * Minor changes to the plugin output, for consistency
131 * New blacklisting keyword 'bat_charge' disables warning messages
132   related to controller cache battery charging. Thanks to Robert
133   Heinzmann for a patch.
134 * For blacklisting, the component ID kan now be "ALL", in which all
135   components of that type is blacklisted.
136 * Man page is moved to manual section 8
137
138
139 3.4.9   2009-08-07
140 ------------------
141
142 * Fixed a bug that could cause errors and weird results when checking
143   cooling devices (fans) via SNMP. Thanks to Ken McKinlay for spotting
144   this bug and reporting it.
145
146 3.4.8   2009-07-31
147 ------------------
148
149 * For failed physical drives, check_openmanage will now output the
150   drive's vendor, model and size in GB or TB.
151
152 3.4.7   2009-07-24
153 ------------------
154
155 * The -s|--snmp option was redundant and no longer does anything. SNMP
156   is triggered automatically if the -H|--hostname option is
157   present. The -s|--snmp option is kept for compatibility, but has no
158   effect.
159
160 3.4.6   2009-07-07
161 ------------------
162
163 * Added support for performance data (temperatures) from attached
164   storage enclosures such as the MD1000
165
166 3.4.5   2009-06-22
167 ------------------
168
169 * Fixed a regression in the --htmlinfo option when it is not supplied
170   with an argument
171
172 3.4.4   2009-06-22
173 ------------------
174
175 * New option --htmlinfo adds clickable HTML links in the plugin's
176   output
177
178 3.4.3   2009-06-11
179 ------------------
180
181 * Fixed a regression bug in CPU and power supply reporting that only
182   affects verbose output
183 * If blacklisting is used, the global health check (via the --global
184   option) is now negated. Checking the global health doesn't make
185   sense when one or more components is blacklisted. Thanks to Rene
186   Beaulieu for reporting this bug
187 * The PNP4Nagios template is now included in the tarball and zip
188   archive
189
190 3.4.2   2009-06-03
191 ------------------
192
193 * Improved memory error reporting, when using omreport
194 * Collect performance data from pwrmonitoring (amperage probes) that
195   were previously ignored when using omreport
196
197 3.4.1   2009-05-25
198 ------------------
199
200 * Improved memory error reporting, when using SNMP
201 * Other small ehnancements
202
203 3.4.0   2009-05-25
204 ------------------
205
206 * The plugin is now compatible with the Nagios embedded Perl
207   interpreter (ePN) in theory. However, the plugin will not not use
208   ePN by default. We don't want any "accidents".
209 * License is now GPLv3, previously only specified as "GPL"
210 * New options --only-critical and --only-warning. With these options
211   the plugin will only print critical or warning alerts, respectively.
212 * Bugfixes and speed enhancements in the storage section, when
213   checking enclosure components via omreport
214 * The --okinfo option is now less verbose and more to the point
215 * Lots of code refactoring for readability, maintainability and
216   robustness
217
218 3.3.2   2009-05-05
219 ------------------
220
221 * Fixed a bug in the storage section, when checking controllers. This
222   is an obscure bug that only manifests itself in the odd case where a
223   server has multiple controllers, and one of the controllers are
224   missing some of the OIDs, in which case these OIDs will be missing
225   for the other controllers as well. The change is minor and only
226   includes using get_table() instead of get_entries() to collect the
227   SNMP result. Thanks to Stephan Bovet for reporting this bug.
228
229 3.3.1   2009-04-28
230 ------------------
231
232 * The --perfdata option can now optionally take an argument
233   "multiline", which makes the plugin produce multiline performance
234   data output in a Nagios 3.x way. Not really needed, but the plugin
235   output is prettier.
236 * Added comment within the 10 first lines to disable the nagios
237   embedded perl (ePN) interpreter by default for Nagios 3.x
238 * Improvements in the performance data output. Units are now included
239
240 3.3.0   2009-04-07
241 ------------------
242
243 * Added --global option, which turns on checking of everything. If
244   used with SNMP, the global system health status is also probed, to
245   protect the user against bugs in the plugin. If used with omreport,
246   the overall chassis health is used.
247 * Support for SNMP version 3
248 * New check added: esmhealth. This checks the overall health of the
249   ESM log, i.e. the fill grade. More than 80% means a warning message
250 * Fixed alert log reporting to use the same format as for the ESM log
251 * Output messages are now sorted by severity
252 * Minor changes in how out-of-date controller firmware/driver is
253   reported
254 * Code refactoring and cleanup
255
256 3.2.7   2009-03-29
257 ------------------
258
259 * Use "omreport about" to collect OMSA version. Slightly faster than
260   "omreport system version". This should give a small speedup in
261   certain configurations
262 * Fixed typo in output when a logical drive is rebuilding. Thanks to
263   Andreas Olsson for reporting
264 * Improved reporting of ESM log content
265 * Added omreport.sh as alternate omreport path
266 * Lots of other small fixes and enhancements
267
268 Plus: A few changes to make the plugin work with old PowerEdge models
269 (e.g. 2550, 2450) and/or old OMSA versions (e.g. version 4.5):
270
271 * Use the chassisModelName OID to determine if SNMP works (instead of
272   BaseboardType)
273 * No longer require a response when checking baseboard type via
274   SNMP. If there is no response, we assume that we're not dealing with
275   a blade server
276
277 Thanks to Christian McHugh for help with testing and debugging this
278 stuff
279
280 3.2.6   2009-03-05
281 ------------------
282
283 * Use 'omreport system operatingsystem' to collect OS info, instead of
284   'omreport system' version which is incredibly slow. This should speed
285   things up in certain configurations.
286 * A few speedups, don't collect information that isn't needed
287 * Man page fixes
288
289 3.2.5   2009-02-24
290 ------------------
291
292 * New option --linebreak to specify the separator between line in case
293   of multiline output
294 * Added support for 64bit Windows. Thanks to Patrick Hemmen for a patch
295 * [Patrick Hemmen] Added install.bat for Windows installation
296 * [Patrick Hemmen] Improvements on install.sh. Will now install in
297   /usr/lib64 for x86_64
298 * RPMs are now architecture dependent, because of different libdir
299
300 3.2.4   2009-02-17
301 ------------------
302
303 * New option -o|--ok-info to display extra information when everything
304   is ok. The plugin can now display storage firmware and driver info,
305   DRAC and BMC firmware, and OMSA version
306 * Support for setting custom minimum temperature thresholds via the
307   -c|--critical and -w|--warning options
308 * Better and more detailed temperature error reporting
309 * Bugfix in the amperage report (including performance data). The
310   plugin now takes into account the correct unit and measurement for
311   amperage probes (other than watts)
312 * New option --port lets the user specify the remote SNMP port number
313
314 3.2.3   2009-02-09
315 ------------------
316
317 * Regression fix: Use the older Processor Device SNMP OIDs for older
318   PowerEdge models, that don't have the new Processor Device Status
319   OIDs. Thanks to Nicole Hähnel for reporting this bug.
320 * Default output (when there are no alerts) now shows RAC firmware,
321   BMC firmware, info about controllers and enclosures (firmware,
322   driver).
323
324 3.2.2   2009-02-03
325 ------------------
326
327 * Regression fix: Ignore unoccupied CPU slots with SNMP probing. This
328   fixes a bug introduced in versjon 3.2.1, which would output
329   something like this if one or more CPU slots were empty: CPU 1 needs
330   attention ()
331
332 3.2.1   2009-02-03
333 ------------------
334
335 * Use Processor Device Status Table OIDs instead of Processor Device
336   Table when checking CPUs via SNMP
337 * Bugfix: don't report throttled CPUs as warnings when checking via
338   SNMP (same as for checking locally)
339
340 3.2.0   2009-01-27
341 ------------------
342
343 * New options --state and --short-state for displaying service state
344   along with the alert
345 * Lots of small fixes for code readability and maintainability
346
347 3.1.1   2009-01-12
348 ------------------
349
350 * Support for running natively on Windows (using omreport.exe). Thanks
351   to Peter Jestico for a patch.
352 * Support for compiled Windows version, i.e. check_openmanage.exe is
353   now a legal script name.
354 * Exit with error if script basename is illegal/unknown
355 * Various small fixes
356
357 3.1.0   2008-12-26
358 ------------------
359
360 * Use of alternate basenames for checking only one class of components
361 * Added support for checking the ESM log via SNMP
362 * Code refactoring for robustness and maintainability
363 * Numerous small fixes and enhancements
364 * Added install script in distribution tarball
365
366 3.0.2   2008-12-20
367 ------------------
368
369 * The script no longer aborts if it can't get system information via
370   SNMP. Give a warning instead, as this is not a critical error
371 * Increased robustness when checking controllers
372
373 3.0.1   2008-12-11
374 ------------------
375
376 * Man page fix in the 'check' section. Thanks to Ansgar Dahlen for
377   reporting this.
378 * Allow invalid command error from 'omreport chassis pwrmonitoring'
379 * Various small fixes
380
381 3.0.0   2008-12-04
382 ------------------
383
384 * Use unique IDs for storage components with regard to blacklisting,
385   which means that the blacklisting API has changed
386 * Added checks for storage components: connectors (channels),
387   enclosures, enclosure fans, enclosure power supplies, enclosure
388   temperature probes and enclosure management modules (EMMs)
389 * Improved verbose output
390 * New option -t|--timeout for setting the plugin timeout
391 * New option -w|--warning for setting custom temperature warning
392   thresholds
393 * New option -c|--critical for setting custom temperature critical
394   thresholds
395 * Option --check can no longer be specified in its short form (-c)
396 * Code cleanup and improvements
397
398 2.1.1   2008-11-24
399 ------------------
400
401 * The workaround for the OMSA bug introduced in OMSA 5.5.0 didn't take
402   multiple controllers into account. This has been fixed.
403
404 2.1.0   2008-11-19
405 ------------------
406
407 * New option -i|--info prefixes all alerts with the service tag
408 * New option -e|--extinfo gives and extra line of output in case of an
409   alert (model and service tag)
410 * New option --postmsg lets the user specify a post message string,
411   with info such as model, service tag etc.
412 * Options -b|--blacklist and -c|--check can now be specified multiple
413   times (actually quite useful)
414
415 2.0.9   2008-11-17
416 ------------------
417
418 * Slightly improved output for alerts on logical drives (vdisks)
419 * Now shows a rebuilding physical disk as a warning, as this is
420   usually accompanied by a degraded vdisk. Previous versions didn't
421   show this at all (omreport classifies it as "OK").
422
423 2.0.8   2008-11-14
424 ------------------
425
426 * Slightly improved output for charging controller batteries
427
428 2.0.7   2008-11-12
429 ------------------
430
431 * Bugfix for reporting physical drives with predictive failure (both
432   via NRPE and SNMP)
433
434 2.0.6   2008-10-30
435 ------------------
436
437 * Fix bug in option handling (ambiguous options)
438 * Slightly improved output if checking the storage subsystem is turned
439   off
440 * Don't complain if there are no logical drives. This is OK. Thanks to
441   Jamie Henderson for reporting this
442
443 2.0.5   2008-10-29
444 ------------------
445
446 * Fix bug in SNMP status level table
447
448 2.0.4   2008-10-29
449 ------------------
450
451 * Added workaround for a BUG introduced in OpenManage 5.5.0. OM
452   sometimes adds a newline in the controller driver version name,
453   which leads to problems parsing the output. Thanks to Hiren Patel
454   for bringing this to my attention.
455
456 2.0.3   2008-10-28
457 ------------------
458
459 * (snmp) Improved handling of cases where OM is not working properly
460
461 2.0.2   2008-10-27
462 ------------------
463
464 * Fixed issue where controller number for physical disks can't be
465   established via SNMP (now identifies as controller no. -1)
466
467 2.0.1   2008-10-23
468 ------------------
469
470 * Correctly identifies and reports error condition in which OpenManage
471   has stopped working (it happens)
472
473 2.0.0   2008-10-23
474 ------------------
475
476 * SNMP support
477 * Same options for checking, blacklisting etc. supported with SNMP
478 * Same output with SNMP as with NRPE
479
480 1.2.1   2008-09-25
481 ------------------
482
483 * Collects performance data if the option '-p' or '--perfdata' is
484   supplied.
485 * New blacklisting directives ctrl_fw and ctrl_driver
486   added. Suppresses the "special" warning messages concerning outdated
487   controller firmware and driver. Useful if you can't or won't
488   upgrade.
489
490 1.1.2   2008-08-06
491 ------------------
492
493 * Fix getting system model and serial number for newer blades
494
495 1.1.1   2008-08-06
496 ------------------
497
498 * Three new checks added:
499   - System battery probes (typical CMOS battery). Newer poweredge
500     models have these
501   - Power consumption monitoring (if the server supports it)
502   - ESM log, with same functionality as the alert log check. Disabled
503     by default.
504
505 1.1.0   2008-08-04
506 ------------------
507
508 * Internal refactoring: use ssv-formatted output from openmanage,
509   resulting in slightly faster execution and increased robustness.
510 * If /usr/bin/omreport doesn't exist, try
511   /opt/dell/srvadmin/oma/bin/omreport.
512 * Allow for no instrumented/redundant power supplies. Needed on
513   low-end poweredge models and blades.
514
515 1.0.3   2008-07-25
516 ------------------
517
518 * Openmanage reports non-critical warning about throttled CPUs on new
519   hardware models. Most og us use ondemand CPU frequency scaling (with
520   throttled CPUs as a result). This specific non-critical warning (CPU
521   Throttled) is ignored from now on.
522 * Remove superfluous Celcius sign when reporting temperatures.
523
524 1.0.2   2008-07-25
525 ------------------
526
527 * Accommodate blade systems with no fans or powersupplies, i.e. accept
528   errors from omreport when trying to check fans or powersupplies on
529   blade servers.
530 * Accommodate newer hardware with slightly different omreport
531   options. Use the newer options if they exist. Not really necessary
532   yet, but deprecated options may be removed in future versions of
533   Dell OpenManage.
534
535 1.0.1   2008-07-18
536 ------------------
537
538 * When everything is OK, check_openmanage now outputs the same info as
539   Gerhard Lausser's excellent check_hpasm plugin does for HP servers:
540
541   OK - System: 'poweredge 2850', S/N: 'XXXXXXX', ROM: 'A06
542   10/03/2006', hardware working fine, 2 logical drives, 4 physical
543   drives
544
545 1.0.0   2008-07-15
546 ------------------
547
548 * Initial release