Title: | Traduce al Español Varios Conjuntos de Datos de Práctica |
Version: | 0.5.1 |
Description: | Provee una versión traducida de los siguientes conjuntos de datos: 'airlines', 'airports', 'AwardsManagers', 'babynames', 'Batting', 'credit_data', 'diamonds', 'faithful', 'fueleconomy', 'Fielding', 'flights', 'gapminder', 'gss_cat', 'iris', 'Managers', 'mpg', 'mtcars', 'atmos', 'palmerpenguins', 'People, 'Pitching', 'planes', 'presidential', 'table1', 'table2', 'table3', 'table4a', 'table4b', 'table5', 'vehicles', 'weather', 'who'. English: It provides a Spanish translated version of the datasets listed above. |
License: | CC0 |
URL: | https://github.com/cienciadedatos/datos |
BugReports: | https://github.com/cienciadedatos/datos/issues |
Depends: | R (≥ 3.5.0) |
Imports: | babynames, dplyr, forcats, fueleconomy, gapminder, ggplot2, Lahman, nasaweather, nycflights13, palmerpenguins, modeldata (≥ 1.0.0), rlang, tibble, tidyr, yaml |
Suggests: | covr, testthat (≥ 2.1.0) |
ByteCompile: | true |
Encoding: | UTF-8 |
Language: | es |
LazyData: | true |
RoxygenNote: | 7.2.1 |
NeedsCompilation: | no |
Packaged: | 2023-07-17 01:14:32 UTC; ciruelo |
Author: | Riva Quiroga |
Maintainer: | Riva Quiroga <riva.quiroga@uc.cl> |
Repository: | CRAN |
Date/Publication: | 2023-07-17 02:20:02 UTC |
datos: Traduce al Español Varios Conjuntos de Datos de Práctica
Description
Provee una versión traducida de los siguientes conjuntos de datos: 'airlines', 'airports', 'AwardsManagers', 'babynames', 'Batting', 'credit_data', 'diamonds', 'faithful', 'fueleconomy', 'Fielding', 'flights', 'gapminder', 'gss_cat', 'iris', 'Managers', 'mpg', 'mtcars', 'atmos', 'palmerpenguins', 'People, 'Pitching', 'planes', 'presidential', 'table1', 'table2', 'table3', 'table4a', 'table4b', 'table5', 'vehicles', 'weather', 'who'. English: It provides a Spanish translated version of the datasets listed above.
Author(s)
Maintainer: Riva Quiroga riva.quiroga@uc.cl (ORCID)
Authors:
Edgar Ruiz edgararuiz@gmail.com
Mauricio Vargas mvargas@dcc.uchile.cl
Mauro Lepore maurolepore@gmail.com (ORCID)
Other contributors:
Rayna Harris rayna.harris@gmail.com [contributor]
Daniela Vasquez daniela.vazquez@gmail.com [contributor]
Joshua Kunst jbkunst@gmail.com [contributor]
See Also
Useful links:
Report bugs at https://github.com/cienciadedatos/datos/issues
Nombres de aerolíneas
Description
Nombres de aerolíneas y su respectivo código carrier de dos dígitos.
Usage
aerolineas
Format
Un data.frame con 16 filas y 2 columnas
- aerolinea
abreviación de dos caracteres del nombre de la aerolínea
- nombre
nombre completo de la aerolínea
Datos de aeropuertos
Description
Metadatos útiles de los aeropuertos
Usage
aeropuertos
Format
Un data.frame con 1.458 filas y 8 columnas
- codigo_aeropuerto
código FAA del aeropuerto
- nombre
nombre del aeropuerto
- latitud
coordenada de ubicación del aeropuerto
- longitud
coordenada de ubicación del aeropuerto
- altura
altura medida en pies
- zona_horaria
diferencia horaria respecto del meridiano de Greenwich (GMT)
- horario_verano
horario legal de acuerdo a las políticas de ahorro de energía. A = Zona Horaria de Ahorro de Luz de Día (DST) estándar de los EEUU: comienza el segundo Sábado de Marzo y termina el primer Sábado de Noviembre. U = Desconocido. N = No tiene zona horaria especial.
- zona_horaria_iana
zona horaria IANA, que se determina de acuerdo al servicio web GeoNames
Datos atmosféricos
Description
Datos atmosféricos
Usage
atmosfera
Format
Un data.frame con 41472 filas y 11 columnas
- latitud
Ubicación de la medida. Grilla espacial de 24 por 24 desde longitud 113.8O a 56.2O y desde latitud 36.2N a 21.2S.
- longitud
Ubicación de la medida. Grilla espacial de 24 por 24 desde longitud 113.8O a 56.2O y desde latitud 36.2N a 21.2S.
- anio
72 puntos en el tiempo. Una vez al mes desde enero de 1995 hasta diciembre de 2000.
- mes
72 puntos en el tiempo. Una vez al mes desde enero de 1995 hasta diciembre de 2000.
- temp_superficie
Temperatura media mensual basada en la energía emitida desde la Tierra en condiciones de cielo despejado (en K).
- temperatura
Temperatura media mensual del aire cerca de la superficie de la Tierra (en K).
- presion
Presión media mensual en una ubicación determinada de la superficie de la Tierra (en mb).
- ozono
Cantidad media mensual de ozono en la columna atmosférica (en Dobsons).
- nube_baja
Porcentaje de la media mensual de cielo cubierto por nubes con una presión superior mayor a 680 mb o aproximadamente menor que 3.24 km.
- nube_media
Porcentaje de la media mensual de cielo cubierto por nubes con una presión superior entre 440-680 mb o aproximadamente menor que 3.24 a 6.5 km.
- nube_alta
Porcentaje de la media mensual de cielo cubierto por nubes con una presión superior menor o igual a 440 mb o aproximadamente mayor que 6.5 km.
Datos de aviones
Description
Metadatos de los aviones y sus códigos de cola en el registro de aviación de la FAA. American Airways (AA) y Envoy Air (MQ) reportan número de flota en lugar de número de cola, por lo que no es posible trazarlos.
Usage
aviones
Format
Un data.frame con 3.322 filas y 9 columnas
- codigo_cola
código de cola
- anio
año de fabricación
- tipo
tipo de avión
- fabricante
fabricante del avión
- modelo
modelo del avión
- motores
cantidad de motores
- asientos
cantidad de asientos
- velocidad
velocidad crucero promedio medida en millas por hora
- tipo_motor
tipo de motor del avión
Tabla de estadísticas de bateo
Description
Estadísticas de bateadores
Format
Un data frame con 105.861 filas y 22 columnas
- id_jugador
ID del jugador
- id_anio
Año
- orden_equipos
Orden en que el jugador se movió entre equipos dentro de la misma temporada
- id_equipo
ID del equipo (factor)
- id_liga
ID de la liga (factor con niveles AA, AL, FL, NL, PL, UA)
- juegos
Número de juegos en los que participó oficialmente el jugador
- al_bate
Turnos al bate
- carreras
Carreras anotadas
- golpes
Cantidad de veces en la que el jugador alcanzó una base debido a un golpe, sin error de la defensa
- dobles
Hits en los que el bateador llegó a segunda base
- triples
Golpes en los que el bateador llegó a tercera base
- cuadrangulares
Cuadrangulares - jonrones
- carreras_empujadas
Carreras empujadas
- bases_robadas
Bases robadas
- atrapado_robando
Atrapado (out) en intento de robo
- base_bolas
Base por bolas
- ponches
Ponches
- base_intencional
Base por bolas intencional
- golpeado
Golpeado por lanzamiento
- toque_sacrificio
Toque de sacrificio
- elavado_sacrificio
Elevado de sacrificio
- doble_matanza
Batazos para doble matanza (doble play)
Tabla de capitanes
Description
Información de los equipos que dirigieron y algunas estadísticas básicas de los equipos en cada año.
Format
Un data frame con 3.504 filas y 10 columnas
- id_jugador
ID del jugador
- anio
Año
- id_equipo
ID equipo (factor)
- id_liga
ID liga (factor)
- en_temporada
Cero si fue capitán del equipo al equipo toda la temporada. En otro caso denota el orden de entrada en la temporada (uno si fue el primer capitán del equipo que entró esa temporada, dos si fue el segundo capitán del equipo que entró esa temporada, etc)
- juegos
Juegos dirigidos
- juegos_ganados
Juegos ganados
- juegos_perdidos
Juegos perdidos
- posicion
Posición del equipo en la clasificación final del año
- jugador_representado
Tiene valor "S" (sí) para los jugadores estuvieron de capitán del equipo durante la temporada y "N" (no) en caso contrario (factor).
Datos de clima
Description
Datos meteorológicos por hora para LGA, JFK y EWR.
Usage
clima
Format
Un data.frame con 3,322 líneas y 9 variables
- origen
Estación de clima
- anio
año de la fecha de registro
- mes
mes de la fecha de registro
- dia
día de la fecha de registro
- hora
hora de la fecha de registro
- temperatura
temperatura medida en grados Fahrenheit
- punto_rocio
temperatura medida en grados Fahrenheit en la que, dada la presión atmosférica y humedad, condensa el vapor de agua
- humedad
humedad relativa
- direccion_viento
dirección del viento medida en grados
- velocidad_viento
velocidad del viento medida en millas por hora
- velocidad_rafaga
velocidad de las ráfagas de viento medida en millas por hora
- precipitacion
precipitación de lluvia medida en pulgadas
- presion
presión atmosférica al nivel del mar medida en milibares
- visibilidad
visibilidad medida en millas
- fecha_hora
fecha y hora de registro en formato POSIXct
Modelos comunes de vehículos
Description
Estos modelos tienen al menos 10 años de datos. Este dataset es adecuado para efectuar un join que restringa el número de observaciones a un nivel manejable.
Usage
comunes
Format
Un data.frame con 347 filas y 4 columnas
- fabricante
Fabricante
- modelo
Modelo
- total_modelos
Número total de modelos
- total_modelos_anio
Número total de modelos-año
Vectores de caracteres dentro del paquete stringr
Description
Muestra de vectores de caracteres para practicar la manipulación de cadenas (strings)
Usage
oraciones
frutas
palabras
Format
Un vector
An object of class character
of length 50.
An object of class character
of length 25.
An object of class character
of length 1000.
Details
oraciones - es una selección y adaptación al español de los datos de práctica contenidos en stringr::sentences.
fruta - es una selección y adaptación al español de los datos de práctica contenidos en stringr::fruit.
palabras - es una selección de las 1000 palabras más frecuentes del Corpus de Referencia del Español Actual (CREA) de la RAE, disponible en github.com/rivaquiroga/frecuencias-crea
Examples
length(oraciones)
oraciones[1:5]
length(frutas)
frutas[1:5]
length(palabras)
palabras[1:5]
Datos de crédito
Description
Datos asociados a créditos de consumo.
Format
Un data.frame con 14 filas y 4454 columnas
- Estado
estado del crédito
- Antiguedad
Antigüedad laboral
- Vivienda
tipo de propiedad de la vivienda
- Plazo
Plazo del crédito en meses
- Edad
edad del cliente
- EstadoCivil
estado civil
- Registros
existencia de registros previos
- Trabajo
tipo de trabajo
- Gastos
cantidad o monto de gastos
- Ingresos
cantidad o monto de ingresos
- Activos
cantidad o monto de activos
- Deuda
cantidad o monto de deudas
- Cantidad
cantidad solicitada de préstamo
- Precio
precio del crédito
Precio de 50.000 diamantes
Description
Un conjunto de datos que contiene los precios de casi 54.000 diamantes.
Usage
diamantes
Format
Un data.frame con 53.940 filas y 10 columnas
- precio
Precio en dólares americanos ($326-$18,823)
- quilate
Peso del diamante (0.2-5.01)
- corte
Calidad del corte (Regular, Bueno, Muy bueno, Premium, Ideal)
- color
Color del diamante, de J (peor) a D (mejor)
- claridad
Medida de que tan claro es el diamante (I1 (peor), SI1, SI2, VS1, VS2, VVS1, VVS2, IF (mejor))
- profundidad
Porcentaje de la profundidad total = z / mean(x, y) = 2 * z / (x + y) (43-79)
- tabla
Ancho de la parte superior del diamante con relación a su punto más ancho (43-95)
- x
Largo en milimetros
- y
Ancho en milimetros
- z
Profundidad en milimetros
Tabla de dirigentes
Description
Información de los equipos que dirigieron y algunas estadísticas básicas de los equipos en cada temporada.
Format
Un data frame con 3.504 filas y 10 columnas
- id_jugador
ID del jugador
- anio
Año
- id_equipo
ID equipo (factor)
- id_liga
ID liga (factor)
- orden_temporada
Orden (secuencia) en la dirigencia de equipos durante una temporada. 0 si fue dirigente del equipo durante toda una temporada. En otro caso denota el orden de entrada a un equipo en una temporada (1 si fue el primer diriente del equipo que entró en esa temporada, 2 si fue el segundo dirigente del equipo que entró en esa temporada, etc.)
- juegos_dirigidos
Juegos dirigidos
- juegos_ganados
Juegos ganados
- juegos_perdidos
Juegos perdidos
- posicion
Posición del equipo en la clasificación final de la temporada regular
- jugador_dirigente
Tiene valor 'S' (sí) para los jugadores que hayan sido jugadores y dirigentes del equipo durante una temporada y 'N' (no) en caso contrario (factor).
Muestra de variables categóricas de una encuesta social
Description
Muestra de variables categóricas de la Encuesta Social General de EE.UU.
Usage
encuesta
Format
Un data.frame con 21.473 filas y 9 columnas
- anio
año de la encuesta, 2000-2014
- estado_civil
estado civil
- edad
edad. Edad máxima truncada a 89 años
- raza
categorías raciales según la encuesta
- ingreso
ingreso reportado por los encuestados (US$)
- partido
partido político con el que se identifica
- religion
religión
- denominacion
denominación religiosa a la que pertenece
- horas_tv
horas de televisión que ve al día
Datos del géiser Viejo Fiel (Old Faithful)
Description
Datos de tiempo de duración y espera entre erupciones del géiser Viejo Fiel (Old Faithful), ubicado en el Parque Nacional de Yellowstone, en Wyoming, Estados Unidos.
Usage
fiel
Format
Un data frame con 272 observaciones y 2 columnas
- erupciones
Tiempo de erupciones, en minutos
- espera
Minutos entre erupciones
Tabla de Fildeo
Description
Estadísticas de jardineros
Format
Un data frame con 140.921 filas y 18 columnas
- id_jugador
ID del jugador
- id_anio
Año
- orden_equipos
Orden en que el jugador se movió entre equipos dentro de la misma temporada
- id_equipo
ID del equipo (factor)
- id_liga
ID de la liga (factor con niveles AA, AL, FL, NL, PL, UA)
- posicion
Posición del jugdador a la defensiva
- juegos_jugados
Juegos jugados
- juegos_iniciados
Juegos iniciados
- InnOuts
Tiempo jugado por el jugador, expresado en outs
- outs_realizados
Outs realizados por el jugador
- asistencias
Asistencias realizadas por el jugador
- errores
Errores realizados por el jugador
- doble_matanzas
Doble matanzas en las que el jugador ha estado envuelto defensivamente
- bolas_pasadas
Bolas dejadas pasar (aplicable a los receptores)
- lanzamientos_desviados
Lanzamientos desviados (aplicable a los receptores)
- bases_robadas
Bases robadas por oponente (aplicable a los receptores)
- atrapados_robando
Oponentes atrapados en intento de robo (aplicable a los receptores)
- clasificacion_zona
Porcentaje de pelotas atrapadas por un fildeador, en su zona defensiva "típica"
Datos sobre la flor Iris de Edgar Anderson
Description
El set de datos sobre la flor Iris entrega las medidas en centímetros del largo y ancho de los sépalos y los pétalos de 50 flores de 3 especies de Iris (setosa, versicolor y virginica).
Usage
flores
Format
Un dataframe con 150 casos (filas) y 5 variables (columnas)
- Largo.Sepalo
Largo del sépalo
- Ancho.Sepalo
Ancho del sépalo
- Largo.Petalo
Largo del pétalo
- Ancho.Petalo
Ancho del pétalo
- Especie
A qué especie de la flor Iris corresponde (setosa, versicolor, virginica)
Tabla de estadísticas de jardineros
Description
Estadísticas de jardineros
Format
Un data frame con 140.921 filas y 18 columnas
- id_jugador
ID del jugador
- id_anio
Año
- orden_equipos
Orden en que el jugador se movió entre equipos dentro de la misma temporada
- id_equipo
ID del equipo (factor)
- id_liga
ID de la liga (factor con niveles AA, AL, FL, NL, PL, UA)
- posicion
Posición del jugdador a la defensiva
- juegos_jugados
Juegos jugados
- juegos_iniciados
Juegos iniciados
- inn_outs
Tiempo jugado por el jugador, expresado en outs
- outs_realizados
Outs realizados por el jugador
- asistencias
Asistencias realizadas por el jugador
- errores
Errores realizados por el jugador
- doble_matanzas
Doble matanzas en las que el jugador ha estado envuelto defensivamente
- bolas_pasadas
Bolas dejadas pasar (aplicable a los receptores)
- lanzamientos_desviados
Lanzamientos desviados (aplicable a los receptores)
- bases_robadas
Bases robadas por oponente (aplicable a los receptores)
- atrapados_robando
Oponentes atrapados en intento de robo (aplicable a los receptores)
- clasificacion_zona
Porcentaje de pelotas atrapadas por un fildeador, en su zona defensiva 'típica'
Tabla de estadísticas de lanzadores
Description
Estadísticas de lanzadores
Format
Un data frame con 46.699 filas y 30 columnas
- id_jugador
ID del jugador
- id_anio
Año
- orden_equipos
Orden en que el jugador se movió entre equipos dentro de la misma temporada
- id_equipo
ID del equipo (factor)
- id_liga
ID de la liga (factor con niveles AA, AL, FL, NL, PL, UA)
- juegos_ganados
Juegos jugados ganados
- juegos_perdidos
Juegos jugados perdidos
- juegos_jugados
Juegos jugados
- juegos_iniciados
Juegos jugados iniciados
- juegos_completados
Número de juegos completos (9 innings lanzados) que lanzó el jugador
- blanqueadas
Número de blanqueos (juegos completos sin permitir carreras) que lanzó el jugador
- juegos_salvados
Juegos salvados
- IPouts
Outs propinados al equipo contrario (Igual a innings lanzados x 3)
- hits
Hits permitidos del oponente
- carreras_ganadas
Carreras limpias recibidas
- cuadrangulares
Cuadrangulares recibidos
- BB
Base por bolas cedidas al oponente
- ponches
Ponches propinados al oponente
- promedio_bateo_rival
Promedio de bateo del rival
- promedio_carreras_ganadas
Promedio de carreras limpias permitidas (normalizada a 9 innings lanzados)
- IBB
Base por bolas intencionales cedidas al oponente
- lanzamientos_desviados
Lanzamientos desviados lanzados por el lanzador
- HBP
Bateadores golpeador por el lanzador
- BK
Balks (movimiento ilegal del cuerpo realizado por el lanzador)
- BFP
Bateadores a los que el lanzador se ha enfrentado
- juegos_finalizados
Juegos en los que el lanzador finalizó el juego
- carreras
Carreras recebidas (sucias y limpias)
- sacrificios_golpeados
Toques de sacrificio que el oponente le hizo al lanzador
- vuelos_sacrificio
Elevado (fly) de sacrificio que el oponente le hizo al lanzador
- doble_matanza
Doble matanza inducidas por el lanzador
Datos de economía de combustible de 1999 y 2008 para 38 modelos populares de automóviles
Description
Este conjunto de datos contiene un subconjunto de los datos de economía de combustible que la Agencia de Protección Medioambiental (EPA) pone a disposición en http://fueleconomy.gov. Contiene solo modelos que tuvieron una nueva versión cada año entre 1999 y 2008, lo que fue utilizado como un proxy de la popularidad del modelo.
Usage
millas
Format
Un data.frame con 234 filas y 11 columnas
- fabricante
fabricante
- modelo
nombre del modelo
- cilindrada
tamaño del motor del automóvil, en litros
- anio
año de fabricación
- cilindros
número de cilindros
- transmision
tipo de transmisión
- traccion
tipo de tracción (d = delantera, t = trasera, 4 = 4 ruedas)
- ciudad
millas por galón de combustible en ciudad
- autopista
millas por galón de combustible en autopista
- combustible
tipo de combustible (p = premium, r = regular, e = etanol, d = diesel, g = gas natural comprimido)
- clase
tipo de auto
Pruebas de ruta de automóviles de Motor Trend
Description
Los datos fueron extraídos de la revista Motor Trend de Estados Unidos de 1974, y tiene datos de consumo de combustible y 10 aspectos de diseño y rendimiento para 32 automóviles (modelos de 1973-1974).
Usage
mtautos
Format
Un data.frame con 32 filas y 12 columnas
- millas
millas por galón de Estados Unidos
- cilindros
número de cilindros
- cilindrada
suma del volumen útil de todos los cilindros del motor en pulgadas cúbicas
- caballos
caballos de fuerza brutos
- eje
relación del eje de transmisión trasero
- peso
peso (1000 libras)
- velocidad
tiempo en recorrer 1/4 de milla
- forma
forma del motor (en V o en línea)
- transmision
tipo de transmisión (0 = automático, 1 = manual)
- cambios
número de cambios de la caja de cambios
- carburadores
número de carburadores
Nombres de bebés
Description
Datos completos sobre nombres de bebés provistos por la Social Security Administration de EE.UU. Incluye todos los nombres con al menos 5 usos.
Usage
nombres
Format
Un data.frame con 1924665 observaciones y 5 variables
- anio
Año del registro
- sexo
Sexo del bebé
- nombre
Nombre
- FALSE
Cantidad de ocurrencias
- prop
Proporción
Datos de tuberculosis de la Organización Mundial de la Salud
Description
Subconjunto de datos del informe anual de tuberculosis de la Organización Mundial de la Salud
Usage
oms
Format
Un data.frame con 7.240 filas y 60 columnas
- pais
nombre del país
- iso2
código ISO de dos dígitos del país
- iso3
código ISO de tres dígitos del país
- anio
año
- nuevos_fpp_h014
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 0 a 14 años (014)
- nuevos_fpp_h1524
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 15 a 24 años (1524)
- nuevos_fpp_h2534
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 25 a 34 años (2534)
- nuevos_fpp_h3544
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 35 a 44 años (3544)
- nuevos_fpp_h4554
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 45 a 54 años (4554)
- nuevos_fpp_h5564
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 55 a 64 años (5564)
- nuevos_fpp_h65
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), hombres (h) de 65 o más años
- nuevos_fpp_m014
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 0 a 14 años (014)
- nuevos_fpp_m1524
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 15 a 24 años (1524)
- nuevos_fpp_m2534
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 25 a 34 años (2534)
- nuevos_fpp_m3544
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 35 a 44 años (3544)
- nuevos_fpp_m4554
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 45 a 54 años (4554)
- nuevos_fpp_m5564
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 55 a 64 años (5564)
- nuevos_fpp_m65
casos nuevos, diagnóstico frotis pulmonar positivo (fpp), mujeres (m) de 65 o más años
- nuevos_fpn_h014
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 0 a 14 años (014)
- nuevos_fpn_h1524
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 15 a 24 años (1524)
- nuevos_fpn_h2534
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 25 a 34 años (2534)
- nuevos_fpn_h3544
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 35 a 44 años (3544)
- nuevos_fpn_h4554
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 45 a 54 años (4554)
- nuevos_fpn_h5564
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 55 a 64 años (5564)
- nuevos_fpn_h65
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), hombres (h) de 65 o más años
- nuevos_fpn_m014
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 0 a 14 años (014)
- nuevos_fpn_m1524
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 15 a 24 años (1524)
- nuevos_fpn_m2534
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 25 a 34 años (2534)
- nuevos_fpn_m3544
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 35 a 44 años (3544)
- nuevos_fpn_m4554
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 45 a 54 años (4554)
- nuevos_fpn_m5564
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 55 a 64 años (5564)
- nuevos_fpn_m65
casos nuevos, diagnóstico frotis pulmonar negativo (fpn), mujeres (m) de 65 o más años
- nuevos_ep_h014
casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 0 a 14 años (014)
- nuevos_ep_h1524
casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 15 a 24 años (1524)
- nuevos_ep_h2534
casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 25 a 34 años (2534)
- nuevos_ep_h3544
casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 35 a 44 años (3544)
- nuevos_ep_h4554
casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 45 a 54 años (4554)
- nuevos_ep_h5564
casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 55 a 64 años (5564)
- nuevos_ep_h65
casos nuevos, diagnóstico extrapulmonar (ep), hombres (h) de 65 o más años
- nuevos_ep_m014
casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 0 a 14 años (014)
- nuevos_ep_m1524
casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 15 a 24 años (1524)
- nuevos_ep_m2534
casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 25 a 34 años (2534)
- nuevos_ep_m3544
casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 35 a 44 años (3544)
- nuevos_ep_m4554
casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 45 a 54 años (4554)
- nuevos_ep_m5564
casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 55 a 64 años (5564)
- nuevos_ep_m65
casos nuevos, diagnóstico extrapulmonar (ep), mujeres (m) de 65 o más años
- nuevosrecaida_h014
nuevas recaídas, hombres (h) de 0 a 14 años (014)
- nuevosrecaida_h1524
nuevas recaídas, hombres (h) de 15 a 24 años (1524)
- nuevosrecaida_h2534
nuevas recaídas, hombres (h) de 25 a 34 años (2534)
- nuevosrecaida_h3544
nuevas recaídas, hombres (h) de 35 a 44 años (3544)
- nuevosrecaida_h4554
nuevas recaídas, hombres (h) de 45 a 54 años (4554)
- nuevosrecaida_h5564
nuevas recaídas, hombres (h) de 55 a 64 años (5564)
- nuevosrecaida_h65
nuevas recaídas, hombres (h) de 65 o más años
- nuevosrecaida_m014
nuevas recaídas, mujeres (m) de 0 a 14 años (014)
- nuevosrecaida_m1524
nuevas recaídas, mujeres (m) de 15 a 24 años (1524)
- nuevosrecaida_m2534
nuevas recaídas, mujeres (m) de 25 a 34 años (2534)
- nuevosrecaida_m3544
nuevas recaídas, mujeres (m) de 35 a 44 años (3544)
- nuevosrecaida_m4554
nuevas recaídas, mujeres (m) de 45 a 54 años (4554)
- nuevosrecaida_m5564
nuevas recaídas, mujeres (m) de 55 a 64 años (5564)
- nuevosrecaida_m65
nuevas recaídas, mujeres (m) de 65 o más años
Datos de Gapminder
Description
Extracto de datos de Gapminder sobre expectativa de vida, PIB per cápita y población, según país
Usage
paises
Format
Un data.frame de 1704 filas y 6 columnas
- pais
países incluidos (factor con 142 niveles)
- continente
continentes (factor con 5 niveles)
- anio
desde 1952 a 2007, datos cada 5 años
- esperanza_de_vida
esperanza de vida al nacer, en años
- poblacion
población
- pib_per_capita
PIB per cápita (en dólares americanos, ajustados según inflación)
Source
http://www.gapminder.org/data/
Tabla de personas
Description
Nombres de jugadores, fecha de nacimiento e información bibliográfica. Este archivo se usa para obtener detalles acerca de los jugadores listados en bateadores, lanzadores y otros archivos en que los jugadores están identificados por id_jugador.
Format
Un data frame con 19.617 filas y 26 columnas
- id_jugador
ID del jugador
- anio_nacimiento
Año de nacimiento
- mes_nacimiento
Mes de nacimiento
- dia_nacimiento
Día de nacimiento
- pais_nacimiento
País de nacimiento
- estado_nacimiento
Estado de nacimiento
- ciudad_nacimiento
Ciudad de nacimiento
- anio_fallecimiento
Año de fallecimiento
- mes_fallecimiento
Mes de fallecimiento
- dia_fallecimiento
Día de fallecimiento
- pais_fallecimiento
País de fallecimiento
- estado_fallecimiento
Estado de fallecimiento
- ciudad_fallecimiento
Ciudad de fallecimiento
- nombre
Nombre
- apellido
Apellido
- nombre_completo
Nombre y apellido
- peso
Peso en libras
- estatura
Estatura en pulgadas
- bateador
Si como bateador es diestro (D) o zurdo (Z)
- lanzador
Si como lanzador es diestro (D) o zurdo (Z)
- fecha_primer_juego
Fecha primer juego en primera división
- fecha_ultimo_juego
Fecha último juego en primera división
- id_retrosheet
Código de jugador usado en Retrosheet (http://www.retrosheet.org/)
- id_brw
Código de jugador usado en Baseball Reference website (http://www.baseball-reference.com/)
- fecha_fallecimiento
Fecha de fallecimiento en formato yyyy-mm-dd
- fecha_nacimiento
Fecha de nacimiento en formato yyyy-mm-dd
Medidas de tamaño de pingüinos adultos en busca de comida cerca de la estación Palmer en la Antártica.
Description
Incluye medidas para: especie de pingüino, isla dentro del Archipiélago de Palmer, tamaño (largo de aleta, masa corporal, dimensiones de pico) y sexo.
Usage
pinguinos
Format
Un tibble con 344 filas y 8 variables
- especie
un factor que indica la especie de pingüino (Adelia, Barbijo y Papúa)
- isla
un factor que indica la isla en el archipiélago de Palmer (Biscoe, Dream o Torgersen)
- largo_pico_mm
un número que indica el largo del pico (milímetros)
- alto_pico_mm
un número que indica el alto del pico (milímetros)
- largo_aleta_mm
un entero que indica el largo de la aleta (milímetros)
- masa_corporal_g
un entero que indica la masa corporal (gramos)
- sexo
un factor que indica el sexo del pingüino (hembra, macho)
- anio
un entero que indica el año estudiado (2007, 2008 o 2009)
Source
*** Pingüinos Adelia: Palmer Station Antarctica LTER and K. Gorman. 2020. Structural size measurements and isotopic signatures of foraging among adult male and female Adélie penguins (Pygoscelis adeliae) nesting along the Palmer Archipelago near Palmer Station, 2007-2009 ver 5. Environmental Data Initiative https://doi.org/10.6073/pasta/98b16d7d563f265cb52372c8ca99e60f. *** Pingüinos Papúa: Palmer Station Antarctica LTER and K. Gorman. 2020. Structural size measurements and isotopic signatures of foraging among adult male and female Gentoo penguin (Pygoscelis papua) nesting along the Palmer Archipelago near Palmer Station, 2007-2009 ver 5. Environmental Data Initiative https://doi.org/10.6073/pasta/7fca67fb28d56ee2ffa3d9370ebda689. *** Pingüínos Barbijo: Palmer Station Antarctica LTER and K. Gorman. 2020. Structural size measurements and isotopic signatures of foraging among adult male and female Chinstrap penguin (Pygoscelis antarcticus) nesting along the Palmer Archipelago near Palmer Station, 2007-2009 ver 6. Environmental Data Initiative https://doi.org/10.6073/pasta/c14dfcfada8ea13a17536e73eb6fbe9e. *** Publicado originalmente en: Gorman KB, Williams TD, Fraser WR (2014) Ecological Sexual Dimorphism and Environmental Variability within a Community of Antarctic Penguins (Genus Pygoscelis). PLoS ONE 9(3): e90081. doi:10.1371/journal.pone.0090081
Tabla de premios de los capitanes
Description
Información de los premios de los capitanes de equipo
Format
Un data frame con 179 filas y 6 columnas
- id_jugador
ID del jugador
- nombre_premio
Nombre del premio recibido
- anio
Año
- id_liga
ID liga (factor)
- empate
Tiene valor "S" (sí) para los premios que corresponden a un empate y "N" (no) en caso contrario.
- notas
Comentarios sobre el premio
Tabla de premios de los dirigentes
Description
Información de los premios de los dirigentes de equipo
Format
Un data frame con 179 filas y 6 columnas
- id_dirigente
ID del dirigente
- nombre_premio
Nombre del premio recibido por el dirigente
- anio
Año
- id_liga
ID liga (factor)
- empate
Tiene valor "S" (sí) para los premios que corresponden a un empate y "N" (no) en caso contrario.
- notas
Comentarios sobre el premio
Periodos de 11 presidentes, desde Eisenhower a Obama
Description
Nombre, fecha de inicio y término de su mandato y partido político de 11 presidentes de EE.UU., desde Eisenhower a Obama.
Format
Un data.frame con 11 filas y 4 columnas
- nombre
Nombre del presidente
- inicio
Fecha de inicio de su periodo presidencial
- fin
Fecha de término de su periodo presidencial
- partido
Partido político al que pertenece
Tabla de representantes (bateadores)
Description
Información de los representantes de los bateadores
Format
Un data frame con 3.504 filas y 10 columnas
- id_jugador
ID del jugador
- anio
Año
- id_equipo
ID equipo (factor)
- id_liga
ID liga (factor)
- en_temporada
Cero si representó al equipo toda la temporada. En otro caso denota el orden de entrada en la temporada (uno si fue el primer representante que entró esa temporada, dos si fue el segundo representante que entró esa temporada, etc)
- partidos
Partidos dirigidos
- partidos_ganados
Partidos ganados
- partidos_perdidos
Partidos perdidos
- posicion
Posición del equipo en la clasificación final del año
- jugador_representado
Tiene valor "S" (sí) para los jugadores que tienen representante en la temporada y "N" (no) en caso contrario (factor).
Tabla de salarios
Description
Información de los salarios de los jugadores.
Format
Un data frame con 26.428 filas y 5 columnas
- anio
Año
- id_equipo
ID equipo (factor)
- id_liga
ID liga (factor)
- id_jugador
ID del jugador
- salario
Salario en dólares
Registros de tuberculosis de la Organización Mundial de la Salud (1era variante)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 6 filas y 4 columnas
- pais
Nombre del país
- anio
Año correspondiente a los valores registrados
- casos
Número de casos registrados
- poblacion
Población del país
Registros de tuberculosis de la Organización Mundial de la Salud (2da variante)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 12 filas y 4 columnas
- pais
Nombre del país
- anio
Año correspondiente a los valores registrados
- tipo
Categoría a la que pertenece la observación
- cuenta
Cantidad de observaciones para cada tipo
Registros de tuberculosis de la Organización Mundial de la Salud (3ra variante)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 6 filas y 3 columnas
- pais
Nombre del país
- anio
Año correspondiente a los valores registrados
- tasa
Tasa de casos de tuberculosis en relación a la población total
Registros de tuberculosis de la Organización Mundial de la Salud (variante 4a)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 3 filas y 3 columnas
- pais
Nombre del país
- 1999
Casos registrados el año 1999.
- 2000
Casos registrados el año 2000.
Registros de tuberculosis de la Organización Mundial de la Salud (variante 4b)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 3 filas y 3 columnas
- pais
Nombre del país
- 1999
Población en el año 1999.
- 2000
Población en el año 2000.
Registros de tuberculosis de la Organización Mundial de la Salud (5ta variante)
Description
Contiene observaciones de casos registrados en Afganistán, Brasil y China en los años 1999 y 2000.
Format
Un tibble con 6 filas y 4 columnas
- pais
Nombre del país
- siglo
Siglo correspondiente a los valores registrados
- anio
Año correspondiente a los valores registrados
- tasa
Tasa de casos de tuberculosis con relación a la población total
Datos de economía de combustible
Description
Datos de economía de combustible de la Agencia de Protección Medioambiental (EPA) de EE.UU., 1985-2015. Contiene una selección de variables y no considera vehículos con datos incompletos.
Usage
vehiculos
Format
Un data.frame con 33442 filas y 12 columnas
- id
Identificador único EPA
- fabricante
Fabricante
- modelo
Nombre del modelo
- anio
año de fabricación
- clase
tipo de auto
- transmision
tipo de transmisión
- traccion
tipo de tracción
- cilindros
número de cilindros
- motor
tamaño del motor del automóvil, en litros
- combustible
tipo de combustible
- autopista
millas por galón de combustible en autopista
- ciudad
millas por galón de combustible en ciudad
Datos de vuelos
Description
Datos temporales de todos los vuelos que despegaron de Nueva York (JFK, LGA o EWR) durante 2013.
Usage
vuelos
Format
Un data.frame con 336.776 filas y 19 columnas
- anio
año de la fecha de salida
- mes
mes de la fecha de salida
- dia
día de la fecha de salida
- horario_salida
horario efectivo de salida del vuelo (formato HHMM o HMM), hora local
- salida_programada
horario programado para la salida (formato HHMM o HMM), hora local
- atraso_salida
atraso de la salida en minutos. Valores negativos indican salida adelantada
- horario_llegada
horario efectivo de llegada del vuelo (formato HHMM o HMM), hora local
- llegada_programada
horario programado para la llegada (formato HHMM o HMM), hora local
- atraso_llegada
atraso de la llegada en minutos. Valores negativos indican llegada adelantada
- aerolinea
abreviación de dos letras de la aerolínea. Ver 'aerolineas' para obtener el nombre
- vuelo
número de vuelo
- codigo_cola
código de cola del avión
- origen
origen del vuelo. Ver 'aeropuertos' para metadatos adicionales
- destino
destino del vuelo. Ver 'aeropuertos' para metadatos adicionales
- tiempo_vuelo
cantidad de tiempo en aire, en minutos
- distancia
distancia entre aeropuertos, en millas
- hora
hora del horario programado para la salida
- minuto
minutos del horario programado para la salida
- fecha_hora
fecha y horario programados del vuelo en formato POSIXct