Toshiba[Type the document title][Type the document subtitle]
Franco[Pick the date]
[Type the abstract of the document here. The abstract is
typically a short summary of the contents of the document. Type the
abstract of the document here. The abstract is typically a short
summary of the contents of the document.]
Resumen
Mediante el presente informe se buscara construir modelos
predictivos de la ley de plata y ley de oro en funcin de variables
geometalrgicas y coordenadas respectivamente, obtenidas de un
yacimiento aurfero-argentfero ubicado a una altura promedio de 1800
m.s.n.m.En primera instancia se analiz el archivo Datos.xls que
contaba con un poco ms de 700 datos con informacin de muestras de
produccin tomadas en galeras de explotacin de una veta. Pero antes
de modelar lo anteriormente descrito se debe lidiar primero con los
datos de leyes negativas que no son lgicos, los duplicados que
aportan la misma informacin y los outliers, que corresponden a
datos muy alejados del promedio. Para resolver estos problemas,
primero se sac los datos duplicados junto a las leyes negativas.
Luego se procedi a la realizacin de histogramas para ver si los
datos tenan una distribucin normal antes de aplicar el test de
Grubbs para outliers. Tras el anlisis de grficos se concluy que
para los datos de Espesor y leyes se aplicara una distribucin
Lognormal y las coordenadas sin modificar. Con estas modificaciones
se realiz el test de Grubbs en los datos restantes bajo el criterio
de sacar datos muy alejados del promedio.Para crear un modelo
predictivo de la ley de plata se realiz un test de regresin
polinomial, en el cual se estudi la correlacin con las variables de
Potencia y Ley de cobre por separado para ver la influencia de cada
una y su importancia con respecto a la ley de plata, donde se
concluy que ambas entregan informacin al modelo final. Para el
segundo modelo correspondiente a la ley de oro en funcin de las
coordenadas Norte y Cota se realizaron los mismos pasos que en el
caso anterior creando 2 modelos diferentes, uno solo con la
coordenada Norte y el otro incluyendo a la cota. Ambos modelos
dieron una baja correlacin entre las variables por lo que se
concluy que ambas coordenadas no poseen relacin con la ley de oro y
no son variables eficientes para la construccin de un modelo
predictivo de la ley de un mineral.Como conclusin general se ha
logrado la comprensin de la aplicacin de las regresiones, el uso de
tests y sus distintos criterios, adems y los modelos respondieron
de forma efectiva con unas leves excepciones.
Abstract
Through this report a predictive model for the silver and gold
law will be built, in terms of geometallurgical variables and
coordinates respectably, obtained of from a auriferous-silvery
deposit located to an average height of 1800 m.s.n.m.
On first instance Datos.xls was imported which contained
approximately 700 values with information of samples taken from
galleries of an exploited vein. But before modeling what was
explained, dealing with negative laws, duplicates and outliers
(data that is too apart from the average) is needed. To solve this
problems, in first place the duplicates and the negative laws were
removed. Then histograms were made to analyze if the data had a
normal distribution in order to apply the Grubbs test. In
conclusion, the Potency and the laws of gold and silver had a
lognormal distribution, and the coordinates North and Coat (?)
werent modified. Whit this changes the test of Grubbs was made to
the remaining data to remove the outliers.
To create a predictive model for the silver law a polinomial
regression test was made, studying the correlation of the potency
and the gold law separately too observe the influence and
significance with respect to the silver law. It was concluded that
both of the variables gave information to the final model.
For the second model corresponding to the gold law according to
the coordinates North and Cota , the same steps above were
performed, creating two different models ,one only with North and
the other including Cota. Both models gave a low correlation
between the variables, for this reason, it was concluded that both
coordinates does not have relationship with gold law and aren't
variables efficient to create a predictive model of the law of a
mineral
As a general conclusion, the understanding of the application of
the regressions models, and the use of the Tests and their criteria
was achieved. Also the model responded effectively with some minor
exceptions.
Introduccin
La vida de un proyecto minero est compuesta por varias etapas:
prospeccin, exploracin, evaluacin de proyecto, construccin,
explotacin y cierre de faena. En algunas de estas es necesario
estimar diferentes variables que permitan, por ejemplo, visualizar
la factibilidad de la extraccin del mineral existente.
Para realizar una buena estimacin de los recursos o de alguna
variable minera importante es necesario contar con datos correctos
y precisos que permitan realizar modelos predictivos con el fin de
obtener mayor informacin sobre las variables que estn en
estudio.
En el presente informe se analiza una base de datos
pertenecientes a un yacimiento aurfero -argentfero que contiene
muestras de produccin con informacin sobre las coordenadas
geogrficas (Norte y cota en metros) de su centro de gravedad,
potencia de la veta (metros) y las leyes de oro y plata
(gramo/tonelada).
El anlisis realizado consta de un estudio exploratorio de datos
en donde se detectan anomalas y errores que puedan entorpecer la
posterior formacin de dos modelos predictivos en los que se
relacionan de distinta manera las variables contenidas en la base
de datos.
Con los dos modelos predictivos generados se busc encontrar que
combinacin de variables son las que tienen mayor influencia en la
estimacin de la Ley de plata, el primer modelo toma en cuenta la
ley de oro y la potencia, y el segundo solo las coordenadas
geogrficas (norte, este y cota). Y para finalizar se analiz la real
significancia de los modelos desarrollados basado en parmetros
estadsticos y la influencia lgica y real de las variables usadas en
la prediccin de la ley de plata. .
Objetivos
Objetivos generales Construir un modelo predictivo de la ley de
plata en funcin de la ley de oro y la potencia.
Construir un modelo predictivo de la ley de oro en funcin de las
coordenadas (Norte y Cota).
Objetivos especficos Realizar un estudio exploratorio de los
datos; detectar eventuales anomalas o errores
Analizar la significancia de los modelos predictivos
generados.
Familiarizarse con conocimientos sobre minera y el proceso de
evaluacin de yacimientos.
Antecedentes
Datos de entrada Los datos utilizados en el informe se obtienen
de la planilla de Excel: Datos.xls, la cual contiene informacin de
un yacimiento aurfero-argentfero ubicado a 1800 m.s.n.m en el que
la mineralizacin se ubica en una veta aproximadamente vertical de
poca potencia (espesor) en la direccin este-oeste. Los datos fueron
obtenidos de muestras de produccin generadas a medida que la
explotacin de la veta iba avanzando.
En el archivo hay almacenados 714 datos de cada variable, entre
las que se encuentran las coordenadas geogrficas (Norte y Cota
[m]), las leyes de oro y plata [g/T] y la potencia (espesor de la
veta [m]).
Las leyes de las especies se midieron con un error cuya
desviacin estndar es de un 10% del valor medido, mientras que la
potencia se midi con un error que presentaba una desviacin estndar
de 10 cmMarco Terico
Para el desarrollo de este informe se har uso de Microsoft Excel
2010 para respaldar cada clculo requerido adems de contar con la
herramienta de Anlisis de Datos y con esta desarrollar Histogramas
y Regresiones, donde estas ltimas a travs de un modelo matemtico
que modela una relacin entre una variable dependiente Y, las
variables independientes Xi y un trmino aleatorio , o una regresin
de mayor grado (cuadrtica, cbica, etc.), con el fin de realizar
modelos predictivos y ver que aproximacin es mejor bajo el criterio
de que R^2 sea similar a 1 cuando la aproximacin es buena.
En cuanto a la deteccin de outliers se ocupar el test de Grubbs
tambin conocido como el mximo normado residual de ensayo, es una
prueba estadstica para reconocer valores atpicos en un conjunto de
datos en la que se supone que vienen de una distribucin normal de
la poblacin. Para realizar este test se debe realizar una hiptesis
nula y una alternativa. Luego se aplica el estadstico G de la
siguiente frmula:
Frmula 1
Y para comparar si se aprueba no la hiptesis a un determinado
nivel de confianza, se utiliza la siguiente frmula:
Frmula 2
Con N nmero de datos y la incertidumbre asociada al grado de
confianza
Distribucin Normal o Gaussiana Es una distribucin la cual tiene
una densidad de probabilidad igual a la campana de Gauss.
Frmula 3
Grfico 1
La distribucin normal estndar corresponde a aquella de media 0 y
varianza 1; se denota usualmente como N(0,1).
Distribucin LognormalX tiene distribucin log-normal cuando su
logaritmo sigue una distribucin normal. La densidad de probabilidad
es:
Frmula 3
Grfico 2
Test de FisherSe busca dos varianzas experimentales S12 y S22 y
de dos muestras gaussianas independientes de tamao n1 y n2.
Definindose:
Frmula 4
Bajo la hiptesis nula (H0) de que las muestras provienen de
distribuciones normales con la misma varianza, F tiene una
distribucin de Fisher con n1 - 1 y n2 -1 grados de libertad. Luego
se compara el valor de F con el valor critico para el nivel de
significancia deseado para as poder concluir si rechazar o no
H0.
Ajuste polinomial: Supongamos que se ha ajustado un modelo
polinomial con un determinado grado . Se quiere saber si un modelo
de grado inferior hubiese sido suficiente. Se suele proceder de
forma iterativa:
1. Se testea la hiptesis de que el trmino de mayor grado no es
necesario: = 0. 2. Si se rechaza esta hiptesis, entonces el modelo
de grado es necesario. Si no, se contina el testeo, buscando si un
modelo an ms simple sera suficiente. El paso siguiente es testear
la hiptesis = = 0. 3. Si es preciso, continuar hasta testear = = =
= 0. Si se acepta esta ltima hiptesis, esto significa que la
variable no sirve para modelar la variable.
Los resultados de estos tests pueden presentarse en una tabla de
anlisis de varianza.
Tabla 1 , S: suma de cuadrados ; MS: la media
Regresin PolinomialDetermina la combinacin lineal de varias
variables X1 XM que mejor explica una variable Y. La calidad de la
regresin se puede cuantificar con el coeficiente de determinacin
mltiple (R2): este coeficiente, comprendido entre 0 y 1, mide cunto
se explica la variable al utilizar el modelo de regresin con las
variables regresin con las variables.
Propagacin de ErroresEs importante saber cmo los errores se
propagan a travs de los clculos que uno realiza. En trminos de
varianzas de las mediciones, se tiene:
Frmula 5De forma general, la propagacin de un error a travs de
una funcin puede ser determinada usando las derivadas parciales de
esta funcin (Valida para errores pequeos):
Frmula 6
En trminos de varianzas:
Frmula 7
Conceptos Bsicos Datos atpicos: Datos con valores extremos que
afectan considerablemente las estadsticas bsicas y generan
problemas al aplicar regresin o construir modelosPredictivos. Estos
pueden ser datos errneos o aberrantes (outliers)
Datos errneos: no son considerados como lgicos. Por ejemplo las
leyes negativas., el porcentaje de cobre soluble que sea mayor al
porcentaje de cobre total,etc.
Outliers o datos aberrantes: Un elemento que es
significativamente diferente a los otros datos de la muestra. Las
estadsticas calculadas de una muestra que contenga outliers sern
frecuentemente engaosas.
Anlisis exploratorio de datos : es el tratamiento estadstico al
que se someten los datos obtenidos en un proceso de investigacin en
cualquier campo cientfico. Para mayor rapidez y precisin, todo el
proceso suele realizarse por medios informticos, con aplicaciones
especficas para el tratamiento estadstico (ejemplo: Excel)
Modelo matemtico: uno de los tipos de modelos cientficos que
emplea las matemticas para expresar relaciones entre variables y as
estudiar el comportamiento de sistemas complejos ante situaciones
difciles de observar en la realidad.
Desarrollo
Deteccin eventuales anomalas o errores.
Se analiza el conjunto de datos en bsqueda de posibles errores
en el muestreo, con el fin de poder eliminarlos y realizar un mejor
estudio de stos. En primer lugar se observa que existe informacin
errnea en la ley de plata, donde hay valores negativos que indican
la inexistencia de datos en ese punto. Algunos de stos se presentan
en la Tabla 2 y al no ser valores razonables para una ley mineral,
se decide eliminarlos. Se encuentra un total de 24 porcentajes
negativos.
Tabla 2. Datos errneos: Leyes negativas.
Se identificaron adems datos duplicados, para ello se procedi a
ordenarlos de menor a mayor (con respecto a la coordenada Norte) e
identificar aquellas entradas que coincidan en ambas coordenadas
(Norte y Cota, pues el Este no variaba). Se encontraron un total de
6 datos duplicados, en donde 5 coincidan en su totalidad, por lo
que se elimina directamente el duplicado. En cuanto al restante, se
acepta el que presenta una mayor cercana a la media de las
variables estudiadas. Un extracto de este anlisis se presenta en la
Tabla 3.
Tabla 3. Datos duplicados.
Una vez descartadas las entradas anteriores se realiza un
histograma de las distintas variables (Ver Anexo aslkdfjlfkj ACA
van los histogramas antes de eliminar datos aberrantes), de ellos
se advierte que existen algunos datos atpicos que eventualmente
podran generar problemas al construir los modelos predictivos. Para
declarar estos valores extremos como errneos y eliminarlos es
necesario comprobarlo mediante el Test de Grubbs. Como se requiere
de una distribucin normal de los datos se calcula el logaritmo de
cada variable (Ver anexo dlkjdjlk histogramas con ln y dist
normal). Se calcula para cada variable y se compara con un valor
crtico dado por el tamao de la muestra y un . Para la ley de oro se
tiene un tamao de muestra igual a , y por lo tanto un valor crtico
de . En la Tabla 4 se presentan algunos clculos, no existen datos
aberrantes.
Tabla 4. Eliminacin de outliers: ley de oro.
Para la ley de plata se tiene un tamao de muestra igual a y un
valor crtico de . Se encontraron cero datos aberrantes, en la Tabla
5 se muestra una parte.
Tabla 5. Eliminacin de outliers: ley de plata. Para la potencia
se tiene un tamao de muestra igual a y un valor crtico de . Se
encontraron 8 datos aberrantes y se presenta el valor ms notable en
la Tabla 6.
Tabla 6. Eliminacin de outliers: Potencia.
Para la Cota, al igual que en el caso anterior, se tiene un , un
valor crtico de , y un dato aberrante presentado en la Tabla 7.
Tabla 7. Eliminacin de outliers: Cota.
Para la coordenada Norte, se tiene un , un valor crtico de , y
ningn dato aberrante (ver Tabla 8)
Tabla 8. Eliminacin de outliers: Norte.
Desviacin estndar en el error de acumulaciones.
La desviacin estndar en el error de la acumulacin de oro y plata
se determina mediante propagacin de error en trminos de la
varianza. En este caso se llega a:
Frmula 8
Donde la desviacin estndar de la potencia corresponde a y la
desviacin estndar de las leyes corresponde al del valor medido. Los
valores obtenidos se muestran en la Tabla 9 y 10, para el oro y la
plata respectivamente.
Tabla 9. Desviacin estndar en el error de la acumulacin de
oro.
Tabla 10. Desviacin estndar en el error de la acumulacin de
plata.
Las tablas anteriores solo muestran una fraccin del total de los
resultados obtenidos. Es posible sealar que para ambos casos el
porcentaje del valor de la acumulacin es el mismo para cada fila de
datos. Los resultados numricos del porcentaje de acumulacin que
representa la desviacin estndar respectiva, nos da un valor
promedio del ; con un mnimo del y un mximo del .
Modelo predictivo de la ley de plata en funcin de la ley de oro
y la potencia
Para la construccin de este modelo se trabaj con tres variables
consideradas relevantes: la ley de oro, la potencia y la acumulacin
de oro. En primer lugar se analizan los datos directamente y son
relacionados mediante los modelos presentados en la Tabla 10, donde
se incluye el coeficiente de correlacin ajustado.
Se define previamente:
Tabla 11. Modelos para ley de plata.
De la tabla anterior, es claro que los ajustados presentan
valores muy bajos, a pesar del valor que implica una regresin
aceptable. Es por esto que se decide trabajar con el logaritmo de
las variables (de esta manera distribuyen de forma lognormal),
entonces se definen:
As, se tienen los modelos creados junto a su coeficiente de
correlacin ajustado, que se presentan en la Tabla 12:
Tabla 12. Modelos con logaritmo de las variables.
Se deduce entonces, a causa de lo cercano de los valores de
ajustado a uno, que estos modelos describen de mejor manera la
relacin entre las variables estudiadas. Especficamente se tiene que
el modelo con mejor coeficiente de correlacin ajustado corresponde
al ajuste polinomial de grado 3 para todas la variables sin
constante.
Anlisis de significancia del modelo escogido
El modelo escogido corresponde a (se omiten los
coeficientes):
Frmula 9
Se desea determinar si un modelo de grado inferior es
suficiente, para ello se realiza un anlisis de varianza, donde se
testea la hiptesis de que el coeficiente de mayor grado es o no
necesario. Se lleva a cabo este anlisis con cada variable por
separado y los resultados se presentan en las tablas
siguientes:
Tabla 13. Anlisis de varianza para .
Tabla 14. Anlisis de varianza para .
Tabla 15. Anlisis de varianza para .
Se tiene finalmente uniendo los resultados, el siguiente modelo
para la ley de plata en funcin de la ley de oro, acumulacin de oro
y potencia:
Frmula 10
Con un ajustado de (Para ms detalles de la regresin ver
anexodsdakn()).
Modelo predictivo de la ley de oro en funcin de las
coordenadas
En la construccin de este modelo se utilizaron las variables
Norte y Cota, Las cuales fueron definidas de la siguiente
manera:
Para ver qu relacin existe entre la ley de oro y cada una de las
2 coordenadas se realizaron los siguientes grficos de
dispersin:
Grfico 1 : ley oro v/s Norte
Grfico 2: ley oro v/s Cota
En ambos grficos se puede observar que la ley de oro no sigue
tendencias muy marcadas con respecto a cada variable , pero el caso
ms extremo se da en el grfico 2 en donde ley de oro no guarda
ninguna relacin lineal con la cota, a raz de esto se decidi en
primer lugar desarrollar modelos que solo utilicen la coordenada
norte( variable que tiene mayor relacin con la ley de oro segn
grfico 1) y en segundo lugar , probar modelos que si incluyan a la
cota para ver cul es la real influencia que tiene esta variable en
la estimacin de la ley de oro, que segn el grafico 2 seria
nula.
Modelo :ley de oro en funcin de la coordenada Norte.En el
desarrollo de este modelo slo se dispone de una variable(coordenada
Norte) por lo que se probaron modelos polinomiales de diferentes
grados para encontrar en cual se produca el mayor coeficiente de
correlacin ajustado (R2)
Los resultados fueron los siguientes:
0,0033
0,1185
0,4048
0,1463
0,4254
0,1577
0,4258
0,1697
0,4432
0,4448
Tabla 16: modelos para la ley de oro En la tabla anterior se
puede observar que todos los modelos probados presentan un R2
ajustado muy bajo (inferiores a 0,5), incluso el mximo alcanzado
fue solo 0,4448 perteneciente al modelo de grado 6 para todas las
variables sin constante. A diferencia del modelo anterior, al
aplicarle a la variable Norte esta no sigue una distribucin log
normal, por lo que se decidi utilizarla sin aplicar funcin.
Anlisis de significancia del modelo escogido
El modelo escogido corresponde a (se omiten los coeficientes
):
Frmula 11
Se desea determinar si un modelo de grado inferior es
suficiente, para ello se realiza un anlisis de varianza, donde se
testea la hiptesis:
Test de hiptesis 1
Se lleva a cabo este anlisis con cada variable y los resultados
se presentan en la siguiente tabla:
Tabla 17: Analisis de varianza para coordenada Norte
Uniendo los resultados, se tiene finalmente el siguiente modelo
para la ley de oro en funcin de la coordenada Norte:
CoeficientesSmbolo
Norte 3,48E-01A
Norte2-4,69E-04B
Norte3-7,88E-05C
Norte41,11E-06D
Norte5-5,19E-09E
Norte67,80E-12F
Tabla 18: coeficientes modelo final
Frmula 12Con un R2 ajustado de 0,4448=0,45 aprox.
Modelo: Ley de oro en funcin de la coordenada Norte y la Cota.En
primer lugar ambas variables (Norte y Cota) son relacionadas a la
ley de oro mediante los modelos presentados en la Tabla 19, donde
se incluye el coeficiente de correlacin ajustado.
Modelo R2 ajustado
0,047
0,336
0,411
0,283
0,330
0,431
0,465
0,470
0,474
Tabla 19: Modelos ley de oro en funcin de la coordenada Norte y
la Cota
En la tabla anterior se puede observar que todos los modelos
probados siguen presentando un R2 ajustado muy bajo (inferiores a
0,5), incluso el mximo alcanzado fue solo 0,474 perteneciente al
modelo de grado 6 para todas las variables sin constante.
Anlisis de significancia del modelo escogido
El modelo escogido corresponde a (se omiten los coeficientes
):
Frmula 13
Se desea determinar si un modelo de grado inferior es
suficiente, para ello se realiza un anlisis de varianza, donde se
aplica el test de hiptesis 1.
Se lleva a cabo este anlisis con cada variable y los resultados
se presentan en la siguiente tabla:
Tabla 20: Anlisis de varianza para coordenada Norte
Tabla 21: Analisis de varianza para la Cota.
Uniendo los resultados, se tiene finalmente el siguiente modelo
para la ley de oro en funcin de la coordenada Norte y la
Cota:CoeficientesSmbolo
Norte -1,2383A
Norte20,04006B
Norte3-0,00054C
Norte43,74E-06D
Norte5-1,24E-08E
Norte61,55E-11F
Cota-0,1452G
Cota29,05926E-05H
Tabla 22: Coeficientes del modelo final
Frmula 14 Con un R2 ajustado de 0,469=0,47 aprox.Anlisis del
modelo predictivo para Ley de plata en funcin de Ley de oro y
Potencia.
En este modelo predictivo, se busca encontrar la correlacin
entre la Ley de Plata con los datos de Espesor y Ley de oro
entregadas en el archivo Datos.xls, adems de la adicin del dato
acumulacin, mediante un ajuste polinomial de grado 1 ,2 y 3.Luego
de realizadas estas regresiones, se obtuvieron los coeficientes de
correlacin de la tabla X de la cual se puede observar que la ley de
plata se correlaciona de mejor forma con la Acumulacin y la Ley de
Oro ya que sus coeficientes son cercanos a 1, no as la Potencia que
presenta coeficientes q tienden a cero, dejando ver que su
correlacin en el modelo es mala.Luego se procedi a realizar el
ajuste de los coeficientes para el polinomio del modelo final a
travs del anlisis de significancia de cada variable, donde para el
caso de la acumulacin el ajuste entrego que le corresponde una
correlacin lineal con respecto a la ley de plata, para la variable
de Potencia una correlacin cuadrtica y para la acumulacin una
correlacin lineal (ver tablas 13,14,15).Con estos datos se concluye
que para el modelo final, si se considerar la variable Potencia a
pesar de que su correlacin con la ley de plata sea poca, ya que en
el modelo final se prob que si influye y mejora levemente su R2
ajustado. Finalmente, realizando la regresin del modelo concluido
se lleg a que el R2 para la regresin con constante distinta de cero
es 0,748 con un error tpico de 0,646, y para la regresin con
constante igual a cero el R2 es 0,98 con un error tpico de 0,684
indicando que es una muy buena aproximacin.Ahora resta ver cun
semejante son los resultados del modelo respecto a los datos
entregados para la ley de plata, para eso se observa el grfico 3
donde se presentan la distribucin Lognormal de los datos originales
y los obtenidos por el modelo planteado. En el grfico es posible
apreciar que los valores entregados por el modelo se asemejan en
gran parte a la realidad, pero tiende a subestimar algunos valores.
Grfico 3:modelo final v/s datos Anlisis del modelo predictivo para
Ley de oro en funcin de las coordenas Norte y Cota.
En este modelo predictivo se busca relacionar la ley de oro en
funcin de las coordenadas Norte y Cota. En primer lugar se observan
los grficos 1 y 2 de dispersin de la ley de oro en funcin de cada
variable, de los cuales se deduce que la Cota no presenta ningn
tipo de relacin lineal con la ley de oro.
Se decide separar el procedimiento en dos partes diferentes, en
la primera se realizan modelos considerando solo la variable Norte
que es la que presenta un mayor grado de relacin con la ley de oro
(grafico 1), y en la segunda se prueban modelos que si incluyan a
la variable cota teniendo como objetivo ver cul es la real
influencia que tiene esta variable en la estimacin de la ley de
oro, que segn el grfico 2 seria nula.
Parte 1 :Modelo de la ley de oro en funcin de la coordenada
Norte.Se realizan varios modelos predictivos con la ley de oro en
funcin de la coordenada Norte con el fin de encontrar el que
presentara un mayor coeficiente de correlacin ajustado. Los
resultados obtenidos son los expuestos en la tabla 16, en el que el
mejor modelo es el de grado 6 para todas las variables sin
constante con un R2 =0,4480. Luego se procede a realizar un anlisis
de significancia del cual se obtiene que el mejor modelo sigue
siendo el de grado 6 sin constante (formula 12) por lo que el R2
del modelo final se mantiene (0,448).En el grafico 4 se observa la
relacin entre los datos de la ley de oro y los calculados por el
modelo. A simple vista el modelo final tiende a subestimar a la
mayora de los datos, situacin concordante el bajo R2 del modelo ya
que solo un 45% de los datos calculados concuerda con los de la ley
de oro real. Adems el error tpico del modelo fue superior al 27%,
indicando una muy mala relacin entre las variables y el parmetro a
estimar.
Grfico 4 : Modelo ley de oro v/s datos Parte 2: Modelo de la ley
de oro en funcin de la coordenada Norte y Cota.Se desarrollan
diferentes modelos considerando la variable Norte y la Cota
obteniendo como resultado la tabla 19, de donde se escogi el modelo
con el mayor coeficiente de correlacin ajustado (R2) que
corresponde al de grado 6 para todas las variables sin
constante(R2= 0,474).
Luego se procede a realizar un anlisis de significancia, del
cual se obtiene que el mejor modelo es de grado seis para la
variable Norte y de grado dos para la variable cota (Formula 14) R2
del modelo final es 0,47.En el grafico 5 se observa que el modelo
final tiende a sobreestimar a la mayora de los datos, situacin que
se corrobora con el bajo ndice de correlacin ajustado (R2 ) del
modelo ya que solo un 47% de los datos calculados concuerda con los
de la ley de oro real. Ademas el error tpico fue superior al 25%,
indicando una muy mala relacin entre las variables y el parmetro a
estimar. Grfico 5: modelo ley de oro v/s datos Aunque ambos modelos
son considerados los mejores entre todos los que fueron probados,
no cumplen con calcular ni siquiera el 50% de los datos de manera
correcta ya que los subestiman (considerando solo coordenada Norte)
o sobrestiman (considerando coordenada Norte y cota ). Adems los
coeficientes de cada modelo (tabla 18 y 22) dan muy cercanos a cero
,lo cual es otro indicador de la baja relacin existente entre las
variables. La incorporacin de la coordenada Cota en los modelos es
indiferente, ya que los R2 ajustados y los errores tpicos son muy
parecidos. (0,45 y 0,47 ,27% y 25% respectivamente). Ante todo lo
expuesto, se puede deducir que la ley de oro no tiene ningna
relacin con las coordenadas, por lo que aunque se perfeccionen aun
ms los modelos, jams alcanzaran un R2 aceptable para su
utilizacin.Conclusin.
Los modelos predictivos tienen una gran utilidad ya que permiten
deducir valores en base a la correlacin de datos conocidos, adems
de tener nocin de una distribucin demasiado compleja que se quiera
estudiar. El primer paso que se debe realizar para desarrollar un
modelo predictivo es contar con una base de datos confiable, sin
datos aberrantes ni errneos, lo cual sirve para evitar distorsiones
en la muestra, incrementando la confiabilidad del modelo a
desarrollar.
A lo largo de este informe se desarrollaron 2 modelos
predictivos, utilizando el mtodo del polinomio para la interpolacin
de los datos y aplicando anlisis de varianzas (ANOVA) ,herramientas
con las cuales se obtuvieron las mejores relaciones factibles entre
las variables con las que se contaba. Aunque existen otros mtodos
relacionados, estos fueron descartados dado el gran numero de datos
estudiados, lo cuales los hacan impracticables.
Uno de los modelos predictivos fue el de la ley de plata en
funcin de la ley de oro y la potencia, con el cual se alcanzo un
R^2 ajustado de 0,98, valor que indica la gran precisin en la
estimacin de la ley de plata, por lo que puede ser considerado como
un muy buen modelo predictivo. La variables que presentaba mayor
influencia en el modelo fue la ley de oro ustedes saben mas de
esrte modelo El segundo modelo fue el de la ley de plata en funcin
de las coordenadas Norte y Cota, en donde el mayor R^2 alcanzado
fue de un 0,47 y un error tpico de 27%, , valores que indican la
mala calidad del modelo predictivo , esto se explica por la nula
relacin entre la cantidad de mineralizacin y las coordenadas del
lugar analizado .Por lo tanto para determinar la ley de un mineral
en especfico, se recomienda utilizar las leyes de minerales que
comnmente se encuentren juntos o en lugares cercanos en una veta.
As, si existe una gran cantidad de un mineral a una profundidad X
puede que tambin exista su mineral asociado. Para finalizar, los
modelos se pueden ir complejizando cada vez mas y as alcanzar
valores ms exactos y precisos, pero esto trae consigo un mayor
requerimiento computacional y gasto econmico , razn por la cual se
trata de buscar un equilibrio , desarrollando un modelo con error
asociado aceptable y as evitar gastos de mas.
Bibliografa
Material disponible en internet1. Xavier Emery, Clase 1, anlisis
geoestadstico de datos.
2. Xavier Emery, Clase 2, anlisis geoestadstico de datos .
3. Xavier Emery, Clase 3, anlisis geoestadstico de datos .
Pagina web1.
http://www.mathematicsdictionary.com/spanish/vmd/full/o/outlier.htm
2. http://es.wikipedia.org/wiki/Valor_at%C3%ADpico
3. http://es.wikipedia.org/wiki/Modelo_matem%C3%A1tico
4.
http://www.sonami.cl/files/presentaciones/242/04.%20Etapas%20en%20la%20vida%20de%20un%20proyecto%20minero.pdf
Referencias
Tabla grajsdaksjf
a9,343
b1,911
c-7,569
d-8,568
()
Tabla a (acum)
Tabla b (potencia)
Tabla c (oro)
2