]> git.uio.no Git - check_openmanage.git/blob - CHANGES
jau
[check_openmanage.git] / CHANGES
1 3.6.0   2010-08-30
2 ------------------
3
4 * Storage is no longer allowed to be absent. If the plugin doesn't
5   find a storage controller, it will give an alert. For diskless
6   systems or servers without a Dell controller that OMSA recognizes
7   you will now have to specify '--no-storage' or '--check storage=0'
8   to work around this.
9 * Report the system revision (if applicable) wherever the model name
10   is printed. E.g. "PowerEdge 2950 III" instead of "PowerEdge 2950".
11 * Small change in search path for omreport: The new location for OMSA
12   6.2.0 and later on Linux will be attempted first.
13 * Small bugfix for the '--check' parameter, if the argument is a
14   filename. The file could not contain a linebreak, this has been
15   fixed.
16 * Added an option '--no-storage', which is equivalent to the general
17   option '--check storage=0'.
18
19
20 3.5.10  2010-07-14
21 ------------------
22
23 * If a physical disk is a hot spare, display this information in
24   the debug output
25 * Report the bus protocol (e.g. SAS, SATA) and media type (e.g. HDD,
26   SDD) for physical disks in the debug output, if applicable
27 * Minor fix for 100GB physical disks, write "100GB" instead of "99GB"
28 * SNMP: Use new features of OMSA 6.3.0 to display occupied and total
29   slots in storage enclosures, if applicable. This information is not
30   available with omreport and check_openmanage will not display this
31   info in local mode.
32 * SNMP: Added new processor IDs from the OMSA 6.3.0 MIBs
33 * SNMP: Use connection tables in a proper way to determine controller
34   and enclosure IDs, for use with physical disks and enclosure
35   components (fan, temp sensors etc.). This fixes a long standing bug
36   for servers with more than one controller, if checked via SNMP.
37 * SNMP: Use the nexus ID as last resort to find the controller for
38   physical disks. Workaround for older, broken OMSA versions.
39 * SNMP: Identify enclosures (e.g. '2:0:0') properly so that the
40   reporting with SNMP corresponds to the same report with omreport.
41 * SNMP: added a couple of workarounds for pre-historic OMSA versions
42
43
44 3.5.9   2010-06-29
45 ------------------
46
47 * More fine-grained reporting of temperature warnings for enclosure
48   temperature probes.
49 * Max/min temperature limits for enclosure temp probes are reported in
50   the debug output
51 * Report enclosure temperature probes that are "Inactive" as ok
52 * Don't try to print out the reading of enclosure temperature probes
53   if the reading doesn't exist or is not an integer
54 * Report enclosure EMMs that are "Not Installed" as ok, instead of
55   critical
56 * Corrected typo in the PNP4Nagios template
57
58
59 3.5.8   2010-06-17
60 ------------------
61
62 * Remove reporting of which controller a logical drive is "attached"
63   to, since this information can't be reliably extracted via SNMP.
64 * Avoid collecting Lun ID via SNMP for virtual disks, we don't use it
65 * Report total memory and number of dimms in the ok output
66 * Difference in reporting if amperage probes have discrete readings
67 * Workaround for broken amperage probes
68 * Added workaround for bad temperature probes that yields no reading
69   in SNMP mode
70 * Get OMSA version via SNMP slightly more efficiently
71
72
73 3.5.7   2010-03-19
74 ------------------
75
76 * Added robustness for received SNMP values that are not defined in
77   the MIB. Instead of throwing a perl warning when this happens, the
78   plugin will not report the undefined value.
79 * Defined "Replacing" as a defined state for physical disks in SNMP
80   mode, even though this state is not defined in the MIB. It is
81   reported as such by omreport.
82 * Physical disk brand/model is now reported when the state of the disk
83   is "Rebuilding" or "Replacing".
84 * The state of a physical disk is reported in parentheses when
85   predictive failure is detected. It is useful to know if a disk is
86   online, offline, spare or even failed when predictive failure is
87   reported.
88 * Handling of physical disk predictive failure has been improved
89   overall.
90 * Refactoring of the perfdata code. In conformance with the plugin
91   development guidelines, the UOM (unit of measure) previously
92   reported in the perfdata output has been removed.
93 * The -p or --perfdata option now
94   takes an optional agrument 'minimal', which triggers shorter names
95   for the perfomance data labels. This shortens the output and is a
96   workaround for systems where the amount of output exceeds the 1024
97   char limit of NRPE.
98 * The PNP4Nagios template has been updated. Users of check_openmanage
99   and PNP4Nagios are advised to upgrade. This version of
100   check_openmanage needs the new template.
101 * Lots of other small improvements and updates.
102
103
104 3.5.6   2010-02-23
105 ------------------
106
107 * New option '--use-get_table' is added as a workaround for SNMPv3 on
108   Windows using net-snmp. This option will make check_openmanage use
109   the Net::SNMP function get_table() instead of get_entries() to
110   collect information via SNMP.
111 * Include a blacklisting option 'ctrl_pdisk' which takes the
112   controller number as argument. This blacklisting option only works
113   with omreport and is a workaround for broken disk firmwares that
114   contain illegal XML characters. These characters makes openmanage
115   barf and exit with an error. Patch from Bas Couwenberg.
116 * If the blacklisting keyword "all" is supplied for a component type,
117   that component type is not checked at all, i.e. the commands are
118   never executed. This will make check_openmanage execute faster if
119   blacklisting is heavily used.
120 * Option '--htmlinfo' now has a shorter equivalent '-I'
121 * The option '--short-state' now has a shorter equivalent '-S'
122
123
124 3.5.5   2010-01-22
125 ------------------
126
127 * Fixed an SNMP bug where the plugin didn't handle OID indexes that
128   were not sequential. Thanks to Gianluca Varenni for reporting.
129 * Fixed an SNMP bug when checking old hardware such as the PE 2650 and
130   PE 750. The controller id for physical drives were collected and
131   displayed incorrectly. This release uses an additional OID to fetch
132   this info, which would otherwise be unavailable. Thanks to Gianluca
133   Varenni for reporting this bug.
134 * Should use %snmp_probestatus, not %snmp_status when checking the
135   status of voltage probes. Thanks to Ken McKinlay for a patch.
136 * Fix when identifying blades via SNMP with very old OMSA
137   versions. Patch from Ken McKinlay.
138 * Better way of finding the ID of physical drives via SNMP
139
140
141 3.5.4   2010-01-13
142 ------------------
143
144 * Added support for storport driver version for controllers, only
145   applicable on servers running Windows.  A new blacklisting keyword
146   for suppressing storport driver messages was added.
147 * The "all" keyword in blacklisting is now case insensitive.
148 * More fine-grained reporting in the rare case where a controller
149   battery fails during learning and charging states.
150 * New improved way of reporting perl warnings during execution of the
151   plugin.
152
153
154 3.5.3   2009-12-17
155 ------------------
156
157 * Fix for path to omreport on Linux with OMSA 6.2.0
158 * A couple of other small fixes
159
160
161 3.5.2   2009-11-17
162 ------------------
163
164 * Fix for undefined device name for logical drives (thanks to Pontus
165   Fuchs for a patch)
166 * Fixed a bug in the PNP4Nagios template, that prevented the template
167   from working with PNP4Nagios 0.6. Thanks to the PNP4Nagios team for
168   the fix.
169 * Other small fixes
170
171 3.5.1   2009-10-22
172 ------------------
173
174 * CPU type, family etc. are now reported in case of a CPU failure (and
175   in the debug output)
176 * The debug output now reports Openmanage version and plugin version
177
178
179 3.5.0   2009-10-13
180 ------------------
181
182 * New option '-a' or '--all' turns on checking of everything
183 * The manual page (POD info) is removed from the script and is now in
184   a separate file, to make check_openmanage fully ePN compatible
185 * ePN is no longer disabled by default, check_openmanage no longer has
186   an opinion on whether it should run under ePN or not
187 * The '-m' or '--man' option is no longer available
188 * The option '-v' or '--verbose' is renamed to '-d' or '--debug',
189   which makes more sense wrt. its usage
190 * The '-g' or '--global' option is removed. Checking the global health
191   status is now default if applicable
192 * Checking intrusion detection is now turned on by default
193 * The obsolete option '--snmp' is removed
194 * The option '--state' now has a shorter equivalent '-s'
195 * The basename stuff and options '--only-critical' and
196   '--only-warning' are now replaced by an option '--only'
197 * If plugin is run by Nagios, redirect stderr to stdout
198 * Added option '--omreport', that lets the user specify the full path
199   to the omreport binary
200 * Added non-8bit-legacy default search paths for omreport.exe for
201   Windows boxen
202 * Minor changes to the plugin output, for consistency
203 * New blacklisting keyword 'bat_charge' disables warning messages
204   related to controller cache battery charging. Thanks to Robert
205   Heinzmann for a patch.
206 * For blacklisting, the component ID kan now be "ALL", in which all
207   components of that type is blacklisted.
208 * Man page is moved to manual section 8
209
210
211 3.4.9   2009-08-07
212 ------------------
213
214 * Fixed a bug that could cause errors and weird results when checking
215   cooling devices (fans) via SNMP. Thanks to Ken McKinlay for spotting
216   this bug and reporting it.
217
218 3.4.8   2009-07-31
219 ------------------
220
221 * For failed physical drives, check_openmanage will now output the
222   drive's vendor, model and size in GB or TB.
223
224 3.4.7   2009-07-24
225 ------------------
226
227 * The -s|--snmp option was redundant and no longer does anything. SNMP
228   is triggered automatically if the -H|--hostname option is
229   present. The -s|--snmp option is kept for compatibility, but has no
230   effect.
231
232 3.4.6   2009-07-07
233 ------------------
234
235 * Added support for performance data (temperatures) from attached
236   storage enclosures such as the MD1000
237
238 3.4.5   2009-06-22
239 ------------------
240
241 * Fixed a regression in the --htmlinfo option when it is not supplied
242   with an argument
243
244 3.4.4   2009-06-22
245 ------------------
246
247 * New option --htmlinfo adds clickable HTML links in the plugin's
248   output
249
250 3.4.3   2009-06-11
251 ------------------
252
253 * Fixed a regression bug in CPU and power supply reporting that only
254   affects verbose output
255 * If blacklisting is used, the global health check (via the --global
256   option) is now negated. Checking the global health doesn't make
257   sense when one or more components is blacklisted. Thanks to Rene
258   Beaulieu for reporting this bug
259 * The PNP4Nagios template is now included in the tarball and zip
260   archive
261
262 3.4.2   2009-06-03
263 ------------------
264
265 * Improved memory error reporting, when using omreport
266 * Collect performance data from pwrmonitoring (amperage probes) that
267   were previously ignored when using omreport
268
269 3.4.1   2009-05-25
270 ------------------
271
272 * Improved memory error reporting, when using SNMP
273 * Other small ehnancements
274
275 3.4.0   2009-05-25
276 ------------------
277
278 * The plugin is now compatible with the Nagios embedded Perl
279   interpreter (ePN) in theory. However, the plugin will not not use
280   ePN by default. We don't want any "accidents".
281 * License is now GPLv3, previously only specified as "GPL"
282 * New options --only-critical and --only-warning. With these options
283   the plugin will only print critical or warning alerts, respectively.
284 * Bugfixes and speed enhancements in the storage section, when
285   checking enclosure components via omreport
286 * The --okinfo option is now less verbose and more to the point
287 * Lots of code refactoring for readability, maintainability and
288   robustness
289
290 3.3.2   2009-05-05
291 ------------------
292
293 * Fixed a bug in the storage section, when checking controllers. This
294   is an obscure bug that only manifests itself in the odd case where a
295   server has multiple controllers, and one of the controllers are
296   missing some of the OIDs, in which case these OIDs will be missing
297   for the other controllers as well. The change is minor and only
298   includes using get_table() instead of get_entries() to collect the
299   SNMP result. Thanks to Stephan Bovet for reporting this bug.
300
301 3.3.1   2009-04-28
302 ------------------
303
304 * The --perfdata option can now optionally take an argument
305   "multiline", which makes the plugin produce multiline performance
306   data output in a Nagios 3.x way. Not really needed, but the plugin
307   output is prettier.
308 * Added comment within the 10 first lines to disable the nagios
309   embedded perl (ePN) interpreter by default for Nagios 3.x
310 * Improvements in the performance data output. Units are now included
311
312 3.3.0   2009-04-07
313 ------------------
314
315 * Added --global option, which turns on checking of everything. If
316   used with SNMP, the global system health status is also probed, to
317   protect the user against bugs in the plugin. If used with omreport,
318   the overall chassis health is used.
319 * Support for SNMP version 3
320 * New check added: esmhealth. This checks the overall health of the
321   ESM log, i.e. the fill grade. More than 80% means a warning message
322 * Fixed alert log reporting to use the same format as for the ESM log
323 * Output messages are now sorted by severity
324 * Minor changes in how out-of-date controller firmware/driver is
325   reported
326 * Code refactoring and cleanup
327
328 3.2.7   2009-03-29
329 ------------------
330
331 * Use "omreport about" to collect OMSA version. Slightly faster than
332   "omreport system version". This should give a small speedup in
333   certain configurations
334 * Fixed typo in output when a logical drive is rebuilding. Thanks to
335   Andreas Olsson for reporting
336 * Improved reporting of ESM log content
337 * Added omreport.sh as alternate omreport path
338 * Lots of other small fixes and enhancements
339
340 Plus: A few changes to make the plugin work with old PowerEdge models
341 (e.g. 2550, 2450) and/or old OMSA versions (e.g. version 4.5):
342
343 * Use the chassisModelName OID to determine if SNMP works (instead of
344   BaseboardType)
345 * No longer require a response when checking baseboard type via
346   SNMP. If there is no response, we assume that we're not dealing with
347   a blade server
348
349 Thanks to Christian McHugh for help with testing and debugging this
350 stuff
351
352 3.2.6   2009-03-05
353 ------------------
354
355 * Use 'omreport system operatingsystem' to collect OS info, instead of
356   'omreport system' version which is incredibly slow. This should speed
357   things up in certain configurations.
358 * A few speedups, don't collect information that isn't needed
359 * Man page fixes
360
361 3.2.5   2009-02-24
362 ------------------
363
364 * New option --linebreak to specify the separator between line in case
365   of multiline output
366 * Added support for 64bit Windows. Thanks to Patrick Hemmen for a patch
367 * [Patrick Hemmen] Added install.bat for Windows installation
368 * [Patrick Hemmen] Improvements on install.sh. Will now install in
369   /usr/lib64 for x86_64
370 * RPMs are now architecture dependent, because of different libdir
371
372 3.2.4   2009-02-17
373 ------------------
374
375 * New option -o|--ok-info to display extra information when everything
376   is ok. The plugin can now display storage firmware and driver info,
377   DRAC and BMC firmware, and OMSA version
378 * Support for setting custom minimum temperature thresholds via the
379   -c|--critical and -w|--warning options
380 * Better and more detailed temperature error reporting
381 * Bugfix in the amperage report (including performance data). The
382   plugin now takes into account the correct unit and measurement for
383   amperage probes (other than watts)
384 * New option --port lets the user specify the remote SNMP port number
385
386 3.2.3   2009-02-09
387 ------------------
388
389 * Regression fix: Use the older Processor Device SNMP OIDs for older
390   PowerEdge models, that don't have the new Processor Device Status
391   OIDs. Thanks to Nicole Hähnel for reporting this bug.
392 * Default output (when there are no alerts) now shows RAC firmware,
393   BMC firmware, info about controllers and enclosures (firmware,
394   driver).
395
396 3.2.2   2009-02-03
397 ------------------
398
399 * Regression fix: Ignore unoccupied CPU slots with SNMP probing. This
400   fixes a bug introduced in versjon 3.2.1, which would output
401   something like this if one or more CPU slots were empty: CPU 1 needs
402   attention ()
403
404 3.2.1   2009-02-03
405 ------------------
406
407 * Use Processor Device Status Table OIDs instead of Processor Device
408   Table when checking CPUs via SNMP
409 * Bugfix: don't report throttled CPUs as warnings when checking via
410   SNMP (same as for checking locally)
411
412 3.2.0   2009-01-27
413 ------------------
414
415 * New options --state and --short-state for displaying service state
416   along with the alert
417 * Lots of small fixes for code readability and maintainability
418
419 3.1.1   2009-01-12
420 ------------------
421
422 * Support for running natively on Windows (using omreport.exe). Thanks
423   to Peter Jestico for a patch.
424 * Support for compiled Windows version, i.e. check_openmanage.exe is
425   now a legal script name.
426 * Exit with error if script basename is illegal/unknown
427 * Various small fixes
428
429 3.1.0   2008-12-26
430 ------------------
431
432 * Use of alternate basenames for checking only one class of components
433 * Added support for checking the ESM log via SNMP
434 * Code refactoring for robustness and maintainability
435 * Numerous small fixes and enhancements
436 * Added install script in distribution tarball
437
438 3.0.2   2008-12-20
439 ------------------
440
441 * The script no longer aborts if it can't get system information via
442   SNMP. Give a warning instead, as this is not a critical error
443 * Increased robustness when checking controllers
444
445 3.0.1   2008-12-11
446 ------------------
447
448 * Man page fix in the 'check' section. Thanks to Ansgar Dahlen for
449   reporting this.
450 * Allow invalid command error from 'omreport chassis pwrmonitoring'
451 * Various small fixes
452
453 3.0.0   2008-12-04
454 ------------------
455
456 * Use unique IDs for storage components with regard to blacklisting,
457   which means that the blacklisting API has changed
458 * Added checks for storage components: connectors (channels),
459   enclosures, enclosure fans, enclosure power supplies, enclosure
460   temperature probes and enclosure management modules (EMMs)
461 * Improved verbose output
462 * New option -t|--timeout for setting the plugin timeout
463 * New option -w|--warning for setting custom temperature warning
464   thresholds
465 * New option -c|--critical for setting custom temperature critical
466   thresholds
467 * Option --check can no longer be specified in its short form (-c)
468 * Code cleanup and improvements
469
470 2.1.1   2008-11-24
471 ------------------
472
473 * The workaround for the OMSA bug introduced in OMSA 5.5.0 didn't take
474   multiple controllers into account. This has been fixed.
475
476 2.1.0   2008-11-19
477 ------------------
478
479 * New option -i|--info prefixes all alerts with the service tag
480 * New option -e|--extinfo gives and extra line of output in case of an
481   alert (model and service tag)
482 * New option --postmsg lets the user specify a post message string,
483   with info such as model, service tag etc.
484 * Options -b|--blacklist and -c|--check can now be specified multiple
485   times (actually quite useful)
486
487 2.0.9   2008-11-17
488 ------------------
489
490 * Slightly improved output for alerts on logical drives (vdisks)
491 * Now shows a rebuilding physical disk as a warning, as this is
492   usually accompanied by a degraded vdisk. Previous versions didn't
493   show this at all (omreport classifies it as "OK").
494
495 2.0.8   2008-11-14
496 ------------------
497
498 * Slightly improved output for charging controller batteries
499
500 2.0.7   2008-11-12
501 ------------------
502
503 * Bugfix for reporting physical drives with predictive failure (both
504   via NRPE and SNMP)
505
506 2.0.6   2008-10-30
507 ------------------
508
509 * Fix bug in option handling (ambiguous options)
510 * Slightly improved output if checking the storage subsystem is turned
511   off
512 * Don't complain if there are no logical drives. This is OK. Thanks to
513   Jamie Henderson for reporting this
514
515 2.0.5   2008-10-29
516 ------------------
517
518 * Fix bug in SNMP status level table
519
520 2.0.4   2008-10-29
521 ------------------
522
523 * Added workaround for a BUG introduced in OpenManage 5.5.0. OM
524   sometimes adds a newline in the controller driver version name,
525   which leads to problems parsing the output. Thanks to Hiren Patel
526   for bringing this to my attention.
527
528 2.0.3   2008-10-28
529 ------------------
530
531 * (snmp) Improved handling of cases where OM is not working properly
532
533 2.0.2   2008-10-27
534 ------------------
535
536 * Fixed issue where controller number for physical disks can't be
537   established via SNMP (now identifies as controller no. -1)
538
539 2.0.1   2008-10-23
540 ------------------
541
542 * Correctly identifies and reports error condition in which OpenManage
543   has stopped working (it happens)
544
545 2.0.0   2008-10-23
546 ------------------
547
548 * SNMP support
549 * Same options for checking, blacklisting etc. supported with SNMP
550 * Same output with SNMP as with NRPE
551
552 1.2.1   2008-09-25
553 ------------------
554
555 * Collects performance data if the option '-p' or '--perfdata' is
556   supplied.
557 * New blacklisting directives ctrl_fw and ctrl_driver
558   added. Suppresses the "special" warning messages concerning outdated
559   controller firmware and driver. Useful if you can't or won't
560   upgrade.
561
562 1.1.2   2008-08-06
563 ------------------
564
565 * Fix getting system model and serial number for newer blades
566
567 1.1.1   2008-08-06
568 ------------------
569
570 * Three new checks added:
571   - System battery probes (typical CMOS battery). Newer poweredge
572     models have these
573   - Power consumption monitoring (if the server supports it)
574   - ESM log, with same functionality as the alert log check. Disabled
575     by default.
576
577 1.1.0   2008-08-04
578 ------------------
579
580 * Internal refactoring: use ssv-formatted output from openmanage,
581   resulting in slightly faster execution and increased robustness.
582 * If /usr/bin/omreport doesn't exist, try
583   /opt/dell/srvadmin/oma/bin/omreport.
584 * Allow for no instrumented/redundant power supplies. Needed on
585   low-end poweredge models and blades.
586
587 1.0.3   2008-07-25
588 ------------------
589
590 * Openmanage reports non-critical warning about throttled CPUs on new
591   hardware models. Most og us use ondemand CPU frequency scaling (with
592   throttled CPUs as a result). This specific non-critical warning (CPU
593   Throttled) is ignored from now on.
594 * Remove superfluous Celcius sign when reporting temperatures.
595
596 1.0.2   2008-07-25
597 ------------------
598
599 * Accommodate blade systems with no fans or powersupplies, i.e. accept
600   errors from omreport when trying to check fans or powersupplies on
601   blade servers.
602 * Accommodate newer hardware with slightly different omreport
603   options. Use the newer options if they exist. Not really necessary
604   yet, but deprecated options may be removed in future versions of
605   Dell OpenManage.
606
607 1.0.1   2008-07-18
608 ------------------
609
610 * When everything is OK, check_openmanage now outputs the same info as
611   Gerhard Lausser's excellent check_hpasm plugin does for HP servers:
612
613   OK - System: 'poweredge 2850', S/N: 'XXXXXXX', ROM: 'A06
614   10/03/2006', hardware working fine, 2 logical drives, 4 physical
615   drives
616
617 1.0.0   2008-07-15
618 ------------------
619
620 * Initial release