Descoberta de Conhecimento Em Bases de Dados

  • Published on
    12-Dec-2015

  • View
    3

  • Download
    2

DESCRIPTION

Descoberta de Conhecimento Em Bases de Dados

Transcript

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 1/15

    Espacios. Vol. 35 (N 12) Ao 2014. Pg. 19

    DescobertadeconhecimentoembasesdedadosnoprocessodeproduodealuminaKnowledgediscoveryindatabasesintheproductionprocessofaluminaCarlaReginaMaziaROSA1,CleinaYayoeOKOSHI2MariaTeresinaArnsSTEINER3RuyGomesdaSILVA4WesleyVieiradaSILVA5.

    Recibido:12/08/14Aprobado:24/10/14

    Contenido1.Introduo2.Descriodoproblema3.KDDeDATAMINING4.Metodologia5.Obtenodosresultados6.ConclusoRefernciasbibliogrficas

    RESUMO:Estetrabalhotemporobjetivorealizaraclassificaodepadresquantoaoteordesodacusticacontidonorejeitogeradonoprocessodeproduodealumina.Paratantoforamcoletados1060dados,cadaumdosquaiscomnovevariveiseumasada(teordasodacustica).CombasenoprocessoKDDfoirealizadaumaanliseexploratriasobreosdadose,emseguida,foiaplicadaatcnicadeDataMining,RegressoLogsticaBinria.Pormeiodosresultadosobtidos,podeseconcluirqueareferidaanlisesemostroubastanteeficientenesteestudo,comumataxadeacertogeralde100%deacerto.Palavraschave:BasesdedadosprocessodeproduodealuminaKDDBrasil.

    ABSTRACT:Thispaperaimstoperformtheclassificationofpatternsasthecausticsodacontentcontainedinthewastegeneratedinaluminaproductionprocess.Forboth1060data,eachofwhichhasninevariablesandoneoutput(contentofcausticsoda)werecollected.BasedontheKDDprocessanexploratoryanalysisofthedatawasperformedandthenthedataminingtechnique,BinaryLogisticRegressionwasapplied.Throughtheresultsobtained,wecanconcludethatthisanalysiswasveryefficientinthisstudy,withanoverallaccuracyrateof100%accuracy.KeyWords:DatabasesAluminaproductionprocessKDDBrazil.

    1.IntroduoAproduomineralsecaracterizaporsuarelevncianocontextoeconmico,podendoserconsideradaumadasatividadesmaisimpactantesaosolo,embora,emgeral,noafeteamplasextensesterritoriais.Aproximadamente7%dacrostaterrestrecompostaporalumnio,fazendodesteelementoqumicooterceiromaisabundantenaTerra,depoisdooxignioedosilcio.Aproduodealumniocomeacomamatriaprimabauxita.Amineraodebauxita,porsuavez,caracterizasepelaretiradadavegetao,seguidadeintensamovimentaodascamadassuperficiaisdosoloeaconsequentegeraoderejeitose,porestemotivo,consideradaumaatividadedealtoimpactoambiental.Oalumnioparaserproduzidonecessitadealumina,queextradadabauxitapormeiodeumprocessoqumicocompostoporvriasetapasdetransformaes,atatingiroestadode

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 2/15

    alumina.OprocessomaisutilizadoindustrialmenteoProcessoBayer,queconsisteemmisturarabauxitamodaaumasoluodesodacustica,comaqualamesmareagesobpressoetemperatura,dissolvendoabauxitaeformandoumasoluodealuminatodesdio(Luz,Lins,2005),chamadaderejeito.Orejeitodeumprocessodeproduodealumina,conhecidocomolamavermelha,ficadepositadaembaciasexpostasaomeioambiente,podendodanificloe,porestemotivo,desejvelquetaisteoressejamminimizados.OprocessodeDescobertadeConhecimentoemBasesdeDados(KnowledgeDiscoveryinDatabaseKDD)temsemostradoefetivonagestodeinformaes,doqualaMineraodeDados(DataMiningDM)asuaprincipaletapa.SegundoCardosoeMachado(2008),oDMcapazderevelar,automaticamente,oconhecimentoqueestimplcitoemgrandequantidadedeinformaesarmazenadasnosbancosdedadosdeumaorganizao.AstcnicasdeDMpodemfazerumaanliseantecipadadoseventos,possibilitandoprevertendnciasecomportamentosfuturos,permitindoaosgestoresatomadadedecisesbaseadaemfatosenoemsuposies.DentreosmtodosdeDM,capazesdefazeroreconhecimentodepadres,tmseosmtodosestatsticos,dentreosquaissedestacamaRegressoLogsticaBinria(RLB),asRedesNeurais,asMquinasdeVetoresdeSuporte(SupportVectorMachinesSVM)easmetaheursticasdeumaformageral,resultandoemfunesqueestimemocomportamentodeumconjuntodedados,buscandoamaximizaodesuaeficincia.Assimsendo,opresentetrabalhotemporobjetivodiscriminarosdadosrelativosaosteoresdesodacusticacontidosnalamavermelha(padres),paraqueobtidosnovospadres,suaclassificaopossaserrealizadacomomenorerropossveltendose,assim,condiesdeanteciparaesquepossamminimizaroteordesodacusticacontidanalamavermelha.Paraisso,pretendeseaplicaroprocessoKDDcomatcnicadeRLBnaetapadeDM.Opresenteartigoestorganizadoemseissees.Almdestaseointrodutriatemsenaseo2adescriodoproblemaaquiabordado.Aseo3comtemplaarevisodaliteraturaarespeitodoprocessoKDDedatcnicadeDM,aRLB.Aseo4apresentaametodologia,ouseja,comooproblemaserabordado.Naseo5temseaobtenodosresultados,tantodaanliseexploratriadosdados,quantodaRLB.ParaautilizaodaRLB,sopropostosdoistestescomointuitodeseobterresultadoscomamximaacurcia.Finalmente,naseo6soapresentadasasconsideraesfinais.

    2.DescriodoproblemaAtualmente,omercadomundialpossui46pasesprodutoresdealumnio,ondeoBrasilocupaosextolugar,comaterceiramaiorreservadominrio(bauxita),localizadanaregioamaznicaeemreservasquepodemserencontradasnosudestedoBrasil,naregiodePoosdeCaldaseGoitacazes,MG(Abal,2013).Pormnemtodaabauxitaprocessadageraalumina,poisexisteumgrandepercentualderejeitodoprocessonoaproveitveleconomicamente.Aquantidadederejeitodependedaqualidadedabauxita,queinfluenciadiretamentenaquantidadedelamavermelhagerada.Humarelaodeprodutividadeexistentenaproduodaalumina,sendoquecadatoneladadealuminaproduzida,necessitadeduastoneladasdebauxitaque,conformejcomentado,variadeacordocomaespecificaodecadatipodebauxita.Cadatoneladadebauxitacontmumpercentualdealuminaaproveitvelde50%,sendoqueorestantecompostoporsilicatos,ferro,mangans,potssioeoutrosmetaisnoeconomicamenteexplorveis(alamavermelha).Ofatoqueaquantidadedelamavermelhageradaanualmentetemassumidoenormeproporo,daordemdemilhesdetoneladas,representandoumsrioriscoaomeioambiente.Almdisso,juntocomalamavermelhaperdeseumaquantidadeconsiderveldesodacustica,oquetambmcontribuisignificativamentenoscustosdereposiodesseinsumo,jqueumdosprincipaisinsumosedemaiorcustonaproduodaalumina.

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 3/15

    Ocontroledeteorcusticonorejeitodoprocessodealuminaumdosdesafiosenfrentadospelasempresasdesteramo,queestdiretamenteligadoaocontroleambientaldaorganizao.Asodacusticaumdosprincipaisinsumosnoprocessodeproduodaalumina,quematriaprimanaproduodoalumnio.Anecessidadedeumcontroleefetivodoteorcusticoauxilianosomentenareduodecustosdaorganizao,poiscadatoneladadesodacusticaqueficaretidanorejeitonecessitaserrepostanoprocesso,aqualtemumelevadocustodeaquisio,comotambmreduzosimpactosambientaiscausadospeloprodutoqumico.Comareduodesteteorcusticonalamavermelhahaverapossibilidadedestaserutilizadanafabricaodecermicasenaconstruocivil,jquepoderfazerpartedacomposiodoconcreto.Oalumnioummetalextremamenteimportncianosegmentoindustrial,oquetornaseuconsumocadavezmaior,atravsdadescobertadenovasligasmetlicas,asquaispossibilitamasuaaplicaonosmaisvariadossegmentosindustriaiseatividadesemgeral,sejamdenaturezaeconmicaoudeusodomstico.EleproduzidoemescalacomercialdesdeosculoXVIIIeseumercadovemseexpandindodesdeento.SegundoLuz(2003),aproduoanualdebauxitasuperiora120milhesdetoneladas,ondecercade95%daproduosoutilizadosnaobtenodoalumniometalrgico,peloProcessoBayer,seguidodoprocessoHallHroult,cujoprodutofinalometal,ouseja,oalumniotmproduoestimadaem40milhesdetoneladasporano.Umapequenapercentagemdebauxita(5%)nometalrgicaapscalcinaoaplicadanamanufaturadeabrasivos,refratrios,cimento,entreoutras.Aaluminautilizadaparaprodutosqumicos,nocalcinada,mantendosenaformahidratada.DeacordocomoInternationalAluminiumInstitute(Iai,2013)aproximadamente40%daproduodebauxitaproduzidanomundoprovmdaAustrlia,destacandose,aindacomoprincipaisprodutores:Guiana(14%),Jamaica(11%),Brasil(8%),ndia(5%)China(3%).Asreservasmundiaisdebauxitasestodistribudasnasregiestropicais(57%),mediterrnea(33%)esubtropicais(10%).OprincipalprocessodeextraodeAluminadabauxitafoidesenvolvidoem1858porLeChateliereaperfeioadoposteriormenteem1888porKarlBayer,sendoconhecidoatualmentecomoprocessoBayer(Hindetal.1999).OProcessoBayerextraiaaluminaqueestcontidanabauxita,quandodissolvidaemsoluodesodacusticasobdeterminadascondiesdepressoetemperatura.Oprocessoapresentaumamelhorextrao,dependendodanaturezadominriodebauxita,devidosuasdiferentescaractersticasqumicas.Destemodo,mesmoquediferentesempresasutilizemomesmoprocessodeextrao,acabamobtendodiferentesvaloresdeconcentraodesodacusticanorejeito,devidoamelhoriastecnolgicasimplementadasporcadaunidadefabril.Estimaseumvalorde15g/ldesodacusticaparacadatoneladaderejeitogeradosendoque,atualmente,estematerialacondicionadoembaciasprpriasexpostasaomeioambiente.Talvalorconsideradoelevado,poisasodacusticaumcontaminante.Umresultadoidealseriaumvalornulodesodacusticanalama,pormtalvalorinvivelparaoprocessodevidoseualtocustooperacional.Dependendodosdistrbiosdoprocesso,estevalorpoderchegarem40g/l,quealmdeaumentaracontaminaodalamavermelha,elevaoscustosdeproduo,tendoseemvistaqueestasodacusticanecessitarserrepostanoprocesso.Destamaneira,alamavermelhafoiconsideradaumresduoinaproveitvelparaaindstriadoalumnio(Chaves,1962).McLellanetal.(2009)afirmamqueexistemavanosnabuscadoalinhamentodaindstriamineraleocompromissocomodesenvolvimentosustentvel,atravsdareduodoimpactoocorridopeloprocessoprodutivo.SegundoHilsoneMurck(2000),estaintegraorequerumcompromissodemelhoriaambientalesocioeconmicacontnua,desdeaexploraomineral,passandopelaoperao,atofimdacadeia.Asvariveisindependentesutilizadasnesseestudoforamemumtotaldenove:Vazo,Densidade,Injeo,Vcuo,Nveldabacia,Rotao,Spray,TTS(teortotaldesoda),Sodana

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 4/15

    lama(nveldesodacusticanalamavermelha)eumavariveldependente(resposta),Concentrao(teorfinaldesodacustica).Foramcoletadas1060observaes(quantidadedepadresamostras),dasquais669foramconsideradascomosendodeboaqualidade(teordesodacustica

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 5/15

    Figura1.EtapasdoProcessoKDD.Fonte:Fayyadetal.(1996)SegundoTanetal.(2009)importantenoconfundirostermosDMeKDD,vistoqueKDDtodooprocessoatquesechegueaoresultadodeumpadrodecomportamentodasvariveisourelaes.JDMconsideradaapenasumadasetapas,amaisimportante,quecompemoKDD.ODMconsistedaobtenodepadresparaageraodeconhecimento(Fayyadetal.1996).ODMumareaemergentedentrodaintelignciacomputacionalusadanaanlisedegrandesbancosdedados(Kusiaketal.2000),comageraodepadreseaextraodeinformaesdessasbases(Mcdonaldetal.1998).Permite,porexemplo,examinarasrelaesdesimilaridadeentreasinformaes(Linares,2003).Destaforma,oDMconsistedautilizaodetcnicasdeReconhecimentodePadres(RP),aprendizadodemquinaeestatstica,sejaparaaclassificao,predio,agrupamentoouassociaodepadres.Astcnicassoconcebidasparaagirsobregrandesbancosdedados,comointuitodedescobrirpadresteiserecentesquepoderiamdeoutraforma,permanecerignorados.Estastcnicasvodesdeastradicionaisdaestatsticamultivariada,comoanlisedeagrupamentoseregresses,atmodelosmaisatuaisdeaprendizagem,comoredesneurais,lgicadifusaealgoritmosgenticos.3.1.RegressologisticaSegundoHines(2003),aestatsticatrabalhacomacoleta,apresentao,anliseeusodedadospararesoluodeproblemas,tomadadedecises,desenvolvimentodeestimativaseplanejamentotantodeprodutosquantodeprocedimentos,eaindausadaparaadescrioeacompreensodavariabilidade.Destaforma,umimportanteinstrumentonaestatsticaaanlisemultivariada,quetratatodasasvariveissimultaneamente,sumariandoosdadoserevelandoasuaestruturacomamenorperdadeinformaespossvel(Gauch,1982Pielou,1984).Assimsendo,aRegressoLogstica(RL)definidacomoumatcnicaestatsticadeanlisemultivariadaquepermiteoajustedeumconjuntodevariveisindependentesaumavarivelderespostacategrica.Aocontrriodasvariveiscontnuas,asvariveiscategricaspodemassumirapenasalgunsvaloresparticularesderesposta,podendoestesserbinrios(dicotmicos)cujarespostapossuiapenasdoisnveis(noousim)oupolitmicos(maisdetrsclasses),umaextensodoanterior,noqualarespostapodeassumirmltiplosnveisdesada(Hosmer,Lemeshow,2000).ARLBconsisteemrelacionar,pormeiodeummodelo,avarivelresposta(padrespertencentesaoconjuntoAouB)comosatributosqueinfluenciamemsuaocorrncia(Hairetal.2009).Aspremissasbsicasaserematendidasso:a)amdiacondicionaldaequaodaRLserumvalordefinidoentre"0"e"1"b)oserrosdaequaoseguiroadistribuiobinriaec)osresultadosobtidospodemserentendidosnaformadeprobabilidades(Hosmer,Lemeshow,2000).

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 6/15

    OmodelodeRLpropostoporHosmereLemeshow(2000),assumearelaoexpostanaequao(1),tambmconhecidacomofunologstica.

    onde:(x)=representaaprobabilidadeassociadaa"x".e=ovetordecoeficientesaserestimadocaracterizadocomoumvalorfixo,basedoslogaritmosnaturais(aproximadamente2,718).

    =soosvetoresdasvariveisexplicativasassociadasaoevento.podeserlinearizadapelatransformao:

    onde:1(x)=representaaprobabilidadedenoocorreroevento.

    =representaarazodeprobabilidades.=representaoscoeficientesestimados

    x=representaasvariveisindependentes.ARLBaplicadaaumavariveldependente,sendoqueestavarivelnorepresentaosvaloresdosdadosbrutos,masrepresentaaprobabilidadedoevento.AssimsendotemosparaaRLaequaogeral(3).

    ondetermospadrodasvariveisindependentesestorepresentadosadireitaeaesquerdaestolognaturaldaprobabilidadeeaquantidadeln(odds)chamadadelogit.Destemodo,retirandooproblemadepredioparaforadoslimitesdavariveldependente.Asprobabilidadessorelacionadaspelaequao(4).

    NaRLhumrelacionamentolinearcomasvariveisindependentes,maslinearnasprobabilidadesdelogenonasprobabilidadesoriginais.Comooobjetodeestudoaprobabilidadedeocorrnciadeumevento,aequaologsticapodesertransformadanumaequaonaprobabilidade(5)(Hair,2009).

    Aregressolinearclssica,nosegueumadistribuionormal,masadeBernoulli.Detalmodoquenaregressolinearomtodousadoparaestimaroscoeficientes0,...,nomtododosmnimosquadrados,enaRLusaseomtododamximaverossimilhana,quemaximizemaprobabilidadedeseobteroconjuntoobservadodedados(Hosmer,Lemeshow,2000).Destaforma,naRLminimizaonmerodevariveisparaqueomodeloresultantesejamais

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 7/15

    facilmentegeneralizadoemaisestvelnumericamente,dadoquequantomaisvariveissoincludasnomodelo,maiselesetornadependentedosdados.AtcnicastepwisenaRLoprocessodeinclusoouexclusodevariveisdomodelo,baseadoemcritriostaiscomotesteWald.ParaCrichton(2001),otesteWaldutilizadoparaavaliarseoparmetroestatisticamentesignificativo,obtidoatravsdarazodocoeficientepeloseurespectivoerropadro,esegueumadistribuionormal.Aestatsticadeteste,paraavaliarseoparmetroigualazeroepodeseespecificarpormeiodaequao(6).

    Noentanto,otestedeWald,falhaquandoserejeitacoeficientesquesoestatisticamentesignificativos(Hauck,Donner,1977).Assimsendo,recomendasequeoscoeficientes,identificadosnestetestecomosendoestatisticamentenosignificativos,sejamtestadostambmpelotestedarazodeverossimilhana.Apsestimaroscoeficientesdaequaoderegresso,necessrioverificarsecadavarivelsignificantementerelacionadacomavarivelrespostadomodelo,atravsdostestesdehiptesesestatsticas,queavaliamomodelocomavarivelesemavarivel(Hosmer,Lemeshow,2000).Destaformaotesteestatsticoindicasehouveounodiferenaestatisticamentesignificativaentreasclassificaesobservadaseprevistas.SegundoHair(2000),oajustegeraldomodelopodeseravaliadoutilizandosealgumasmedidascomoo2LL.Contudoseocorrerumdecrscimonovalor2LLcomparadoaomodelobase,existemelhoranomodelo,poisovalormnimopara2LL0,oquecorrespondeaoajusteperfeito.AmedidaR2CoxeSnelloperadamesmaforma,comvaloresmaisaltosindicandomaiorajustedomodelo.Entretanto,estamedidaestlimitadapelofatodequenoconseguealcanarovalormximode1,demodoqueNagelkerkepropsumamodificaoquetemoalcancede0para1.AterceiramedidaamedidaR2"pseudo"combasenamelhoriadovalor2LL.OpseudoR2calculadopormeiodaequao(7).

    ParaHosmereLemeshow(2000)amedidafinaldoajustedomodelomedeacorrespondnciadosvaloresefetivoseprevistosdavariveldependente,queindicadoporumadiferenamenornaclassificaoobservadaeprevistaeaindamostraanosignificncia,indicandoaausnciadediferenanadistribuiodevalores.Ummelhorajustedemodeloindicadoporumvalorchiquadradonosignificante.Porfim,asmatrizesdeclassificao,idnticasemnaturezasusadasnaanlisediscriminante,demostramseastaxasdeacertosoaltasoubaixasparaoscasoscorretamenteclassificadosnomodelo.Destaforma,naRLdevenecessariamenteacharomodeloquemelhorseajusteaosdadosemanlise,comointuitodeconseguirummodelomoderadoerazovel,quepermitadescreverarelaoentreavarivelresultadoeumconjuntodevariveisindependentes.Mota(2007)apresentaumapropostaparaaavaliaodeimveisurbanos(apartamentos,casaseterrenos)atravsdetcnicasdeanlisemultivariadaeredesneuraisartificiais.Steineretal.(2008)utilizaramumametodologia,compostaportcnicasdeanlisemultivariada,paraaconstruodeummodeloestatsticoderegressolinearmltiplaparaavaliaodeimveisemfunodesuascaractersticas.Santosetal.(2007)analisaramariquezaesimilaridadeflorsticadefragmentosflorestaisnoNortedoestadodeMinasGerais,atravsdomtodosdeanlisemultivariada.Toledoetal.(2009)aplicaramanlisemultivariadaparaacaracterizaofitossociolgicaemvegetaodeCerradonoNortedoestadodeMinasGerais.Outrosestudoscomabordagememanlise

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 8/15

    multivariadaforamdesenvolvidosporOliveiraFilho,Fontes(2000)eScudelleretal.(2001)naMataAtlnticadoSudestebrasileiro.

    4.MetodologiaAmetodologiadotrabalhofoidivididaemduasfases,enquadradasnoKDD.A1.fase,aanliseexploratriadedados,incorporaastrsprimeirasetapasdoprocessodoKDD(Figura1japresentada),conformeaFigura2aseguir.A2.fasecontmaetapadeDM(RP)einterpretaodosresultados,conformeaFigura2aseguir.

    Figura2.FasedoProcesso.

    Na1.fasefoirealizadaaestatsticadescritivadosdadosetambmodescartedepadresatpicos.Comaestatsticadescritivafoipossvelidentificarosoutliers,ouseja,queapresentavamcaractersticas"foradopadro".Osoutliersforamidentificadospelaanlisedosescorespadronizados(z).Essesoutliersforamdescartados,poissoconsideradoscomopadresatpicos.Na2.fasefoiaplicadaatcnicautilizadadeRLparaamineraodosdados,ouseja,paraaclassificaodosmesmose,emseguida,foramobtidoseinterpretadososseusresultados.Nessa2.faseforamrealizadosdoistestes:oprimeiro,comaquantidadedepadres(observaesdaamostra)resultantesda1.fase,ouseja,apsaeliminaodosoutlierse,em

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 9/15

    seguida,utilizadaaferramentaRL.Osegundotestefoirealizadoapsaeliminaodosoutliers,seguidadadeterminaodovalormdiodeumadasvariveisanalisadasnoestudo(varivel"densidade"),conformesermostradomaisadiantee,finalmente,foiplicadaaRL.

    5.ObtenodosresultadosOsresultadosforamobtidospormeiodaaplicaodasduasfases:anliseexploratriaeRLsobreosdados.

    5.1.AnliseexploratriadedadosNaanliseexploratriadedadosforamrealizadosaestatsticadescritivadosdadoseodescartedepadresatpicos.EstafaseocorreucomoauxliodosoftwareSPSS13.0.Aestatsticadescritiva,apresentadanaTabela2aseguir,foirealizadacomas1060(dadosbrutos)observaes,dasquais669pertencemclasse"Bom"e391classe"Ruim".

    Tabela2Estatsticadescritivadosdadosbrutos

    ATabela2destacaqueosdesviospadresdamaioriadasvariveisestoacimade"3",ouseja,apontandoaexistnciadedadosatpicos(outliers),quedeveroserexcludos,poispoderoinfluenciarnegativamente,piorandoodesempenhodaRL,nosresultadosdaanlisefinal.Dessaformafundamentalidentificareexcluirosoutliersparaqueoresultadosejamaisconfivel.Osoutliersforamanalisadosatravsdosescorespadronizados(z).Foramexcludososdadosqueapresentaramz3paracadaumadasvariveisanalisadasindividualmente.Destaforma,foramexcludas82observaes(dados)e,portanto,aamostraficoucom978observaes(624daclasse"Bom"e354daclasse"Ruim").ATabela3apresentaaestatsticadescritivacomosdadosapsaexclusodosoutliers.

    Tabela3Estatsticadescritivaapsaexclusodosdadosatpicos(outliers)

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 10/15

    PormeiodaTabela3possvelnotarqueosdesviospadresdasvariveis,analisadasdeformaconjunta,diminuramapsaexclusodos82dados.Apsadeterminaodanovaamostrafoirealizadaa2.fasequedescreveoprocessoparaautilizaodatcnicadaRL.5.2.RegressologsticaAtcnicadeDM,RL,foiaplicadapormeiodarealizaodedoistestes.Paraoprimeirotestefoiutilizadaaamostracom978observaeseosegundotesteutilizouumanovaamostracom488observaes.Asobservaesparaosegundotesteforamformadasatravsdaretiradadeobservaesdaprimeiraamostrapormeiodovalormdiodavarivel"densidade"(detalhadomaisadiante)estesegundotestefoirealizado,poisosresultadosdoprimeirotesteforaminsatisfatrios,ouseja,insuficientesparaobterumdesempenhoaceitveldaRL.A.PrimeirotesteAtcnicadeRLfoiaplicadas978observaesobtidasapsa1fase(exlusodosoutliers),comoauxliodosoftwareSPSS13.0utilizandoomtodostepwisefoward,paradefiniromodelofinalqueminimizaonmerodevariveisemaximizaaprecisodomodelo.ATabela4,conhecidacomo"matrizdeconfuso",apresentaaclassificaoparaas978observaes.Ataxadeacertoglobalfoide69,1%eastaxasindividuaisdeacertosforam:paraaclasse"Bom",de86,4%eparaaclasse"Ruim",de38,7%.Assim,dos624padresdaclasse"Bom",apenas85estonaclassificaode"Ruim"edos354padresconsiderados"Ruins"detinham217padres"Bons".Ouseja,oresultadoconsideradonotosatisfatrio.

    Tabela4Tabeladeclassificaoparaas978observaes

    ATabela5apresentaoresumodomodelodoprimeiroteste,destacandoosndices"R2CoxeSnell"de11,4%e"R2Nagelkerke"de15,7%.O"R2CoxeSnell"indicaqueapenas11,4%dasvariaesocorridasnaRLsoexplicadaspeloconjuntodasvariveisindependentes,ouseja,estendiceapresentaumbaixondicedeexplicao.Ondice"R2Nagelkerke"indicaque15,7%dasvariaesregistradasnavariveldependente(Concentrao)soocasionadaspelasvariveisindependentes.Ouseja,estendicetambmapresentabaixaexplicao.

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 11/15

    Tabela5Resumodomodeloparaas978observaes

    Poressemotivofoirealizadoumnovotestequeresultasseemmelhoriadaqualidadenoreconhecimentodospadresdaamostra.Assim,pararealizarosegundotesteanalisouseasvariveisquenodetinhaminflunciasobreomodelodoprimeiroteste,comomostradonaTabela6.

    Tabela6AnlisedasvariveisnopossueminfluncianomodelodeRL

    ATabela6apresentatodasasnovevariveisanalisadaseseunveldesignificncia.Podeseobservarqueexistem4variveisindependentes(densidade,injeo,vcuoenveldabacia)quenoinfluenciamomodelo,poisovalordep>0,05paratodaselas.Comoa"densidade"temumnveldesignificnciamaiordoqueasdemaistrsvariveis,oscomportamentosdosdadosdessavarivelforam,ento,melhoranalisados.Ocomportamentodosdadosdavarivelindependente"densidade"foianalisadopormeiodesuamdiaamostral(mdia=1,514).Ocomportamentoapresentouqueamaioriadasobservaesclassificadascomo"Bom"estavanointervalo1,425densidade1,514equeamaioriadasobservaesclassificadascomo"Ruim"estavanointervalodensidade

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 12/15

    classificaodosresduos.

    Tabela7Classificaosegundoteste(488observaesetodasasvariveis)

    Aprimeiravarivelaserincludanomodeloseraquelaquetiveraestatsticadepontuaomaisalta,estatsticaWald,nocaso,avarivel"densidade".Natabela8,verificamosqueaanlisedirecionadaaetapautilizandoaestatsticaWaldconsumiuumaetapaatseobteromodelofinal.Observandoseassignificnciasestatsticasdomodelo,constatamosqueocoeficientesignificantedaetapa,conformeatabela8.

    Tabela8TestesdecoeficientesdemodeloOmnibus

    Aps20iteraes,omodelofinalselecionouapenasumavarivel,a"densidade",dasnovevariveisincludasinicialmentenomodelo,excluindotodasasdemaisoitovariveis.ATabela9mostraqueondice"R2deCoxeSnell"situousenopatamarde73,6%eo"R2Nagelkerke"ficouem100%.Asmagnitudesdasduasestatsticassoconsiderveis.

    Tabela9Resumodomodelo

    NaTabela10mostraqueoteste"HosmereLemeshow"indicaaausnciadediferenasignificativanadistribuiodevaloresdependentesefetivoseprevistos.Umbomajustedemodeloindicadoporumvalorchiquadradonosignificante(HAIRetal.,2009),comooobservadonomodelo.IstodemostraqueomodelosignificantedeRL.

    Tabela10TestedeHosmereLemeshow

    Asmatrizesdeclassificao,idnticasemnaturezasutilizadasnaanlisediscriminante(HAIRetal.,2009),mostramtaxadeacertoextremamentealtadecasoscorretamenteclassificadosparaomodelo.NaTabela11,ataxadeacertogeralde100%e,deformaadicional,astaxasdeacertodegruposindividuaissoconsistentementealtasenoindicam

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 13/15

    umproblemanaprevisodequalquerumdosdoisgrupos.Astaxasdeacertodoconjuntodepadresclassificadoscomo"Bom"amesmaqueadoconjuntodepadresclassificadoscomo"Ruim",de100%.Omodeloinicialqueconsideravaapenasaconstantetinhaumataxageraldeacertode61,7%.Jomodelocompletocomumavarivel("densidade")apresentouataxadeacertode100%.

    Tabela11Classificaosegundoteste(488observaes,comapenasavarivel"densidade")

    ATabela12mostraqueumavarivelindependenteestatisticamentesignificativaparaexplicaroteordesodacusticacontidanalamavermelha.OscoeficientesdeRLdasaludidasvariveisapresentamsignificnciaestatstica,conformeindicadopelotestedeWald.

    Tabela12VariveisincludasnomodelodeRL(apenasa"densidade")

    a=Variveisinseridasnaetapa1:Densidade.NaTabela13possvelverificarquetodasasvariveisquenoforamincludasnomodelo,exibiramcoeficientesqueso,estatisticamente,iguaisazero,ouseja,(p>0,05)e,consequentemente,noexercemimpactosobreoresultadofinal(classificao"Bom"ou"Ruim").

    Tabela13VariveisnopresentesnomodelodeRL

    6.ConclusoOpresentetrabalhoutilizouaanliseexploratriadosdadoseaRL,enquadradasnoprocesso

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 14/15

    KDD,afimdeidentificarnorejeitodoprocessodeproduodealumina(teordesodacusticanalamavermelha),ospadresdasvariveisdeentradaquecontrolamoprocesso.Foramidentificadasasvariveisqueinterferemnocontroledoteorcusticodorejeitodoprocessoequeforamutilizadascomovariveisdeentradadoprocedimentodeclassificaoeprevisodestetrabalho.possvelafirmarqueomodelodeRLpodesereficienteparaaprevisodoteordesodacusticacontidanalamavermelhaapartirdevariveiscontidasnomodelo.VisandoobteromelhordesempenhopossvelparaatcnicadeRL,foramrealizadosdoistestes:emumprimeirotestefoiaplicadoomodelodeRLaumaamostradedadoscom978observaes,cujosresultadosnoforamsatisfatrios.Emumsegundotestefoiutilizadaumaamostrade488observaes,comaqualobteveseumataxadeacertogeraldomodelodeRLde100%,comaseleodeapenasumavarivel,a"densidade".Combasenaclassificaoeficiente,poderemosutilizaromodelodeRLparapreveraclassificaodenovospadres.Casoaprevisoindiquequeopadroaindaemformaovserdequalidade"Ruim",aideiaseriainterferirnasvariveisdeentrada,aummnimocusto,paraqueoprocessoforneaumproduto(teordesodacustica)dequalidade"Bom".

    RefernciasbibliogrficasASSOCIAOBRASILEIRADOALUMNIO.Disponvelem:.Acessoem:fev./2013.CARDOSO,O.N.P.MACHADO,R.T.M.(2008)Gestodoconhecimentousandodatamining:estudodecasonaUniversidadeFederaldeLavras.RevistadeAdministraoPblica,v.42,n.3,p.495528.CHAVES,A.G.F.(1962)Alamavermelhaesuaeliminaodafbricadealumina,In:2semanadeestudos.AlumnioeZinco.SociedadedeIntercmbioCulturaleEstudosGeolgicosdosAlunosdaEscoladeMinasdeOuroPreto,n.2,OuroPreto,MinasGerais.CRICHTON,N.(2001)Waldtest.JournalofClinicalNursing,v.10,p.697706.FAYYAD,U.M.SHAPIRO,G.P.SMYTH,P.(1996)Fromdataminingtoknowledgediscovery:anoverview.In:FayyadUM,ShapiroGP,SmythP,UthursamyR,editors.Advancesinknowledgediscoveryanddatamining.Cambridge:TheMITPress/London:AAAIPressp.134.FAYYAD,U.M.PIATETSKYSHAPIRO,G.SMYTH,P.(1996)Knowledgediscoveryanddatamining:towardsaunifyingframework.ProceedingoftheSecondInternationalConferenceonKnowledgeDiscoveryandDataMining(KDD96),Portland,Oregon,august.GAUCH,H.G.(1982)Multivariateanalysisincommunityecology.Cambridge:CambridgeUniv.Press.HAIR,J.F.BLACK,W.C.BABIN,B.J.ANDERSON,R.E.TATHAM,R.L.(2009)Anlisemultivariadadedados.6.ed.PortoAlegre:Bookman.HAUCK,W.W.DONNER,A.(1977)Wald'stestasappliedtohypothesesinlogitanalysis.JournaloftheAmericanStatisticalAssociation,v.72,n.360a,p.851853.HILSON,G.MURCK,B.(2000)Sustainabledevelopmentintheminingindustry:clarifyingthecorporateperspective.ResourcesPolicy,v.26,p.227238.HIND,R.A.BHARGAVA,S.K.GROCOTT,S.C.(1999)ThesurfacechemistryofBayerprocesssolids:areview.ColloidsandsurfacesA:physicochemicalandengineeringaspects,n.146,p.359374.HINES,W.W.(2006)Probabilidadeeestatsticanaengenharia.4.Ed.,traduodeVeraReginaLimadeFariaseFlores,RiodeJaneiro.HOSMER,D.W.LEMESHOW,S.(2000)Appliedlogisticregression.NewYork:Wiley&Sons.INTERNATIONALALUMINIUMINSTITUTE(IAI)Disponvelem.AcessoemFev./13.

  • 22/02/2015 RevistaESPACIOS|Vol.35(N12)Ao2014

    http://www.revistaespacios.com/a14v35n12/14351219.html 15/15

    KUSIAK,A.KERN,J.A.KERNSTINE,K.H.TSENG,B.T.L.(2000)Autonomousdecisionmakingadataminingapproach.IEEETransInfTechnolBiomed,v.4,n.4,p.274284.LINARES,K.S.C.(2003)Aspectostericosdodatamining:descobertadoconhecimentoemmedicina(TesedeDoutorado).Florianpolis:UniversidadeFederaldeSantaCatarina.LUZ,A.B.(2003)Rochasemineraisindustriais,EditoraCETEM/MCT,RiodeJaneiro.LUZ,A.B.LINS,F.A.F.(2005)Rochas&mineraisindustriais:usoseespecificaes.2.ed.RiodeJaneiro:CETEM/MCT.MCDONALD,J.M.BROSSETTE,S.MOSER,S.A.(1998)Pathologyinformationsystems,dataminingleadstoknowledgediscovery.ArchivesofPathology&LaboratoryMedicine,v.122,n.5,p.40911.MCLELLAN,B.C.CORDER,G.D.GIURCO,D.GREEN,S.(2009)Incorporatingsustainabledevelopmentinthedesignofmineralprocessingoperationsreviewandanalysisofcurrentapproaches.JournalofCleanerProduction,v.17,p.14141425.MOTA,J.F.(2007)Umestudodecasoparaadeterminaodopreodevendadeimveisurbanosviaredesneuraisartificiaisemtodosestatsticosmultivariados(DissertaodeMestrado).Curitiba:UniversidadeFederaldoParan.OLIVEIRAFILHO,A.T.FONTES,M.A.L.(2000)PatternsoffloristicdifferentiationamongAtlanticForestsinSoutheasternBrazilandtheinfluenceofclimate.Biotropica,v.32,n.4,p.793810.PIELOU,E.C.(1984)Theinterpretationofecologicaldata:aprimeronclassificationandordination.NewYork:JohnWiley&SonsPubl.SANTOS,R.M.VIEIRA,F.A.FAGUNDES,M.NUNES,Y.R.F.GUSMO,E.(2007)RiquezaesimilaridadeflorsticadeoitoremanescentesflorestaisnonortedeMinasGerais,Brasil.Revistarvore,v.31,n.1,p.135144.SCUDELLER,V.V.MARTINS,F.R.SHEPHERD,G.J.(2001)DistributionandabundanceofarborealspeciesintheatlanticombrophilousdenseforestinSoutheasternBrazil.PlantEcology,v.152,n.2,p.185199.STEINER,M.T.A.NETO,A.C.BRAULIO,S.N.ALVES,A.C.(2008)Mtodosestatsticosmultivariadosaplicadosengenhariadeavaliaes.GestoProduo,v.15,n.1,p.2332.TAN,P.N.STEINBACH,M.KUMAR,V.(2009)Introduoaodataminingmineraodedados.RiodeJaneiro:CinciaModerna.TOLEDO,L.O.ANJOS,L.H.C.COUTO,W.H.CORREIA,J.R.PEREIRA,M.G.CORREIA,M.E.F.(2009)AnlisemultivariadadeatributospedolgicosefitossociolgicosaplicadanacaracterizaodeambientesdecerradononortedeMinasGerais.Revistarvore,v.33,n.5,p.957968.

    1.PontifciaUniversidadeCatlicadoParanPUCPRBrasilcarla.rosa@pucpr.br2.PontifciaUniversidadeCatlicadoParanPUCPRBrasilcleina.okoshi@pucpr.br3.PontifciaUniversidadeCatlicadoParanPUCPRBrasilmaria.steiner@pucpr.br4.PontifciaUniversidadeCatlicadoParanPUCPRBrasilruyrgs@gmail.com5.PontifciaUniversidadeCatlicadoParanPUCPRBrasilwesley.vieira@pucpr.br

    Vol.35(N12)Ao2014[ndice]

    [Encasodeencontraralgnerrorenestewebsitefavorenviaremailawebmaster]

Recommended

View more >