Nach dem Entfernen von Beobachtungen mit Energieverbrauchsintensitäten unterhalb des 1. Perzentils und oberhalb des 99. Perzentils nach primärem Raumtyp, um Ausreißer zu eliminieren, enthält die resultierende gereinigte Datenbank 8.648 Gebäude verschiedener Nutzungsarten. Zusätzliche Maßnahmen wurden ergriffen, um die Genauigkeit und Gültigkeit der verbleibenden Beobachtungen zu gewährleisten, einschließlich Der Bedürftigkeitsprüfung mit einer qualitätskontrollierten Stichprobe des Datensatzes (New York City 2012). Die gelöschten Beobachtungen deuten auf eine Reihe von Dateneingabefehlern hin und spiegeln in einigen Fällen Unsicherheiten bei der Meldung untypischer Umstände im Zusammenhang mit der Gebäude- und Zählerkonfiguration wider. Zum Beispiel könnten zwei Gebäude auf zwei getrennten Parzellen, aber mit einem gemeinsamen Zähler, mit dem gesamten Energieverbrauch eingegeben worden sein, der nur einem Gebäude zugeschrieben wird (und somit zu einem Nullenergieverbrauch für das andere führt) oder durch willkürliche Zuweisung des Energieverbrauchs zwischen den beiden Gebäuden. Baustoffe beeinflussen die Gebäudeenergieleistung in einer Reihe von Dimensionen. Selbst nach der Kontrolle des Baualters weisen Mauerwerksgebäude niedrigere EUIs als Bauträger um etwa 7 % auf, was darauf hindeutet, dass die Verbreitung von Glasvorhangwandsystemen zusätzliche Überlegungen zu den potenziellen Auswirkungen solcher Büro- (und zunehmend Wohn-)Designtrends auf die Gebäudeenergieeffizienz erfordern könnte. Abbildung 5 unten zeigt die räumliche Verteilung von Bürogebäuden nach Quelle EUI. Vor allem in den Teilmärkten Midtown und Downtown sind Cluster von hohen EUI-Gebäuden offensichtlich. Die hervorgehobenen Bereiche zeigen die Ansammlung von hohen EUI-Gebäuden vom 34.
bis 59., insbesondere von der Park Avenue bis zur Seventh Avenue, und die Schwierigkeiten bei der Meldung des Energieverbrauchs für mehrere Gebäude auf einem Grundstück, was durch die Bedingungen im oberen Kasten belegt wird. Die Identifizierung und Visualisierung räumlicher Clustering kann wichtige Erkenntnisse für gezielte Strategien, Infrastrukturinvestitionen und potenzielle Anwendungen der dezentralen Energieerzeugung liefern. Das vollständige Modell erklärt etwa 33 % der Variation der Energieintensität zwischen Bürogebäuden, wie in der Regressionsausgabe in Abb. 10 dargestellt. Dieses Modell enthält eine einzigartige Palette von Gebäudeeigenschaften, einschließlich Gebäudeklasse, Losortung, Nutzungsmuster und Baumaterial, obwohl diese begrenzte Systemebene und Daten zum Mandantentyp seine erklärende Leistung einschränken. Die angezeigten Koeffizientenschätzungen können als prozentuale Veränderung des Quell-EUI für eine Einheitenänderung in der unabhängigen Variablen angenähert werden. Es sei darauf hingewiesen, dass die genaue Interpretation der Beziehung zwischen Dummy-Variablen und der abhängigen Variablen durch exp(c)-1 gegeben wird, wobei c der Koeffizientenwert ist (Halvorsen und Palmquist 1980).